caffe的python接口学习(6):用训练好的模型(caffemodel)来分类新的图片

经过前面两篇博文的学习,我们已经训练好了一个caffemodel模型,并生成了一个deploy.prototxt文件,现在我们就利用这两个文件来对一个新的图片进行分类预测。

我们从mnist数据集的test集中随便找一张图片,用来进行实验。

#coding=utf-8

import caffe
import numpy as np
root='/home/xxx/'   #根目录
deploy=root + 'mnist/deploy.prototxt'    #deploy文件
caffe_model=root + 'mnist/lenet_iter_9380.caffemodel'   #训练好的 caffemodel
img=root+'mnist/test/5/00008.png'    #随机找的一张待测图片
labels_filename = root + 'mnist/test/labels.txt'  #类别名称文件,将数字标签转换回类别名称

net = caffe.Net(deploy,caffe_model,caffe.TEST)   #加载model和network

#图片预处理设置
transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape})  #设定图片的shape格式(1,3,28,28)
transformer.set_transpose('data', (2,0,1))    #改变维度的顺序,由原始图片(28,28,3)变为(3,28,28)
#transformer.set_mean('data', np.load(mean_file).mean(1).mean(1))    #减去均值,前面训练模型时没有减均值,这儿就不用
transformer.set_raw_scale('data', 255)    # 缩放到【0,255】之间 #训练的时候使用scale参数对像素值进行了归一化,测试时为什么缩放到0-255之间?? 
transformer.set_channel_swap('data', (2,1,0))   #交换通道,将图片由RGB变为BGR

im=caffe.io.load_image(img)                   #加载图片
net.blobs['data'].data[...] = transformer.preprocess('data',im)      #执行上面设置的图片预处理操作,并将图片载入到blob中

#执行测试
out = net.forward()

labels = np.loadtxt(labels_filename, str, delimiter='\t')   #读取类别名称文件
prob= net.blobs['Softmax1'].data[0].flatten() #取出最后一层(Softmax)属于某个类别的概率值,并打印
print prob
order=prob.argsort()[-1]  #将概率值排序,取出最大值所在的序号 
print 'the class is:',labels[order]   #将该序号转换成对应的类别名称,并打印

这里写图片描述
这里写图片描述
最后输出 the class is : 5

分类正确。

如果是预测多张图片,可把上面这个文件写成一个函数,然后进行循环预测就可以了。

有个疑问,希望路过的读者会的可以帮忙解答一下。拜谢~
前一篇博客训练模型的时候,在train.prototxt中data层指定参数
transform_param {
scale: 0.00390625
}
训练的时候图片的像素值会做归一化。但是在本篇博客中却把图片的像素值缩放的0-255,这样做不会有问题吗? 为什么要这么做?
还有我想请教,caffe的数据层如果设置成ImageData类型的,那在训练的时候它是怎么读取图片的呢?像caffe.io.load_image函数一样读取?读取的是单通道图像还是三通道图像?是0-1范围的还是0-255范围的?

原文链接:caffe的python接口学习(6):用训练好的模型(caffemodel)来分类新的图片

猜你喜欢

转载自blog.csdn.net/liuweiyuxiang/article/details/80960099