caffe的python接口学习（6）：用训练好的模型（caffemodel）来分类新的图片

经过前面两篇博文的学习，我们已经训练好了一个caffemodel模型，并生成了一个deploy.prototxt文件，现在我们就利用这两个文件来对一个新的图片进行分类预测。

我们从mnist数据集的test集中随便找一张图片，用来进行实验。

#coding=utf-8

import caffe
import numpy as np
root='/home/xxx/'   #根目录
deploy=root + 'mnist/deploy.prototxt'    #deploy文件
caffe_model=root + 'mnist/lenet_iter_9380.caffemodel'   #训练好的 caffemodel
img=root+'mnist/test/5/00008.png'    #随机找的一张待测图片
labels_filename = root + 'mnist/test/labels.txt'  #类别名称文件，将数字标签转换回类别名称

net = caffe.Net(deploy,caffe_model,caffe.TEST)   #加载model和network

#图片预处理设置
transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})  #设定图片的shape格式(1,3,28,28)
transformer.set_transpose('data', (2,0,1))    #改变维度的顺序，由原始图片(28,28,3)变为(3,28,28)
#transformer.set_mean('data', np.load(mean_file).mean(1).mean(1))    #减去均值，前面训练模型时没有减均值，这儿就不用
transformer.set_raw_scale('data', 255)    # 缩放到【0，255】之间 #训练的时候使用scale参数对像素值进行了归一化，测试时为什么缩放到0-255之间？？ 
transformer.set_channel_swap('data', (2,1,0))   #交换通道，将图片由RGB变为BGR

im=caffe.io.load_image(img)                   #加载图片
net.blobs['data'].data[...] = transformer.preprocess('data',im)      #执行上面设置的图片预处理操作，并将图片载入到blob中

#执行测试
out = net.forward()

labels = np.loadtxt(labels_filename, str, delimiter='\t')   #读取类别名称文件
prob= net.blobs['Softmax1'].data[0].flatten() #取出最后一层（Softmax）属于某个类别的概率值，并打印
print prob
order=prob.argsort()[-1]  #将概率值排序，取出最大值所在的序号 
print 'the class is:',labels[order]   #将该序号转换成对应的类别名称，并打印

这里写图片描述

最后输出 the class is : 5

分类正确。

如果是预测多张图片，可把上面这个文件写成一个函数，然后进行循环预测就可以了。

有个疑问，希望路过的读者会的可以帮忙解答一下。拜谢~
前一篇博客训练模型的时候，在train.prototxt中data层指定参数
transform_param {
scale: 0.00390625
}
训练的时候图片的像素值会做归一化。但是在本篇博客中却把图片的像素值缩放的0-255，这样做不会有问题吗? 为什么要这么做？
还有我想请教，caffe的数据层如果设置成ImageData类型的，那在训练的时候它是怎么读取图片的呢？像caffe.io.load_image函数一样读取？读取的是单通道图像还是三通道图像？是0-1范围的还是0-255范围的？

原文链接：caffe的python接口学习（6）：用训练好的模型（caffemodel）来分类新的图片

caffe的python接口学习（6）：用训练好的模型（caffemodel）来分类新的图片

猜你喜欢