Windows环境下使用 Caffe在ImageNet上训练网络

在配置好Windows版的Caffe之后,可以使用Windows Caffe训练ImageNet网络,主要有4个步骤:

(1)准备图片数据库

(2)将图片数据转换为Caffe可以使用的LMDB或者LevelDB类型

(3)取数据库均值

(4)开始用Caffe训练网络

1 准备图片数据库

可以从网上找到ImageNet的数据,选择几个图片类别下载下来。我是从ilsvrc2012的数据中找了几个类别。我找到的数据库是这样的:


上面每个文件中都是如下的一堆图片:


任意选择几个类别作为训练数据。我选了如下的三类。每个类别中有1300张图片,在每个类别中抽取100张图片作为验证集,余下的1200张作为训练集。将训练集和验证集存储在相应的路径下。



运行如下两个matlab脚本(脚本来自“http://blog.csdn.net/u013657981/article/details/49497753”),可以生成制作数据库所需要的train.txt和val.txt。

clear all
clc
foodDir='F:\caffe-windows\data\ilsvrc12\train';
numClasses=3
classes=dir(foodDir)
classes = classes([classes.isdir]) ;
classes = {classes(3:numClasses+2).name}
imageName={};
fp = fopen('train.txt','a');
for ci = 1:length(classes)
  ims = dir(fullfile(foodDir, classes{ci}, '*.JPEG')) 
    for ii=1:length(ims)
        fprintf(fp,classes{ci});
        fprintf(fp,'/');
        fprintf(fp,ims(ii).name);
        fprintf(fp,' ');
        fprintf(fp,'%d',ci);
        fprintf(fp,'\r\n');
    end
end
fclose(fp);


clear all
clc
foodDir='F:\caffe-windows\data\ilsvrc12\val';
numClasses=3
classes=dir(foodDir)
classes = classes([classes.isdir]) ;
classes = {classes(3:numClasses+2).name}
imageName={};
fp = fopen('val.txt','a');
for ci = 1:length(classes)
  ims = dir(fullfile(foodDir, classes{ci}, '*.JPEG')) 
    for ii=1:length(ims)
        fprintf(fp,classes{ci});
        fprintf(fp,'/');
        fprintf(fp,ims(ii).name);
        fprintf(fp,' ');
        fprintf(fp,'%d',ci);
        fprintf(fp,'\r\n');
    end
end
fclose(fp);


然后把生成的train.txt和val.txt拷贝到合适的路径下以备使用(我是把它们拷贝到了F:\caffe-windows\data\ilsvrc12 路径下)。两个文件内容如下所示。




2 生成数据库

数据库可以选择LMDB或者LevelDB两种类型。

使用如下批处理命令,可以实现训练集的转化,生成LMDB数据库。

F:\caffe-windows\Build\x64\Release\convert_imageset.exe --resize_height=256 --resize_width=256 --shuffle --backend="lmdb" F:\caffe-windows\data\ilsvrc12\train\ F:\caffe-windows\data\ilsvrc12\train.txt  F:\caffe-windows\examples\imagenet\ilsvrc12_train_lmdb
Pause


在使用如下命令,可以实现验证集的数据库转化。

F:\caffe-windows\Build\x64\Release\convert_imageset.exe --resize_height=256 --resize_width=256 --shuffle --backend="lmdb" F:\caffe-windows\data\ilsvrc12\val\ F:\caffe-windows\data\ilsvrc12\val.txt  F:\caffe-windows\examples\imagenet\ilsvrc12_val_lmdb
Pause



3 数据库均值

F:\caffe-windows\Build\x64\Release\compute_image_mean.exe --backend="lmdb" F:\caffe-windows\examples\imagenet\ilsvrc12_train_lmdb F:\caffe-windows\examples\imagenet\train_mean.binaryproto
Pause



4 训练网络

我们采用的是caffe自带的一些网络,一些参数如下,有些我们可以根据自己的需要修改。比如,我将最大迭代次数改为了30000。“train_val.prototxt”文件位于F:\caffe-windows\models\bvlc_alexnet 路径中我的caffe的根目录是F:\caffe-windows)。


在同一个目录下还有文件“solver.prototxt”。网络结构参数中,要把数据库文件和均值文件路径写对。用了相对路径的地方,默认是从caffe的根目录执行。



由于上面文件中有的参数使用了相对路径,所以我们需要打开Windows命令行窗口,cd到caffe的根目录,执行以下命令:

F:\caffe-windows\Build\x64\Release\caffe.exe train --solver=F:\caffe-windows\models\bvlc_alexnet\solver.prototxt
pause

或者把它写到一个批处理文件中,在caffe根目录下执行该文件。运行中截图如下:


运行完成后截图如下。在使用了GPU的前提下,我的电脑总共花了2个半小时来完成这个任务。




发布了65 篇原创文章 · 获赞 265 · 访问量 55万+

猜你喜欢

转载自blog.csdn.net/zzlyw/article/details/62444142