inception-v3模型:google图像识别的网络模型
1. 在线下载模型代码:
import tensorflow as tf
import os
import tarfile
import requests
# inception-v3 是googlenet的第三个版本
#inception模型下载地址
inception_pretrain_model_url = 'http://download.tensorflow.org/models/image/imagenet/inception-2015-12-05.tgz'
#这里采用手动下载后直接放入下述模型存放地址中。
#模型存放地址,解压后的文件也是存在这里
inception_pretrain_model_dir = "inception_model" #此文件夹如果不存在会自动创建,保存在这个文件夹下
if not os.path.exists(inception_pretrain_model_dir):
os.makedirs(inception_pretrain_model_dir)
#获取文件名,以及文件路径
filename = inception_pretrain_model_url.split('/')[-1]
filepath = os.path.join(inception_pretrain_model_dir, filename)
#下载模型
if not os.path.exists(filepath):
print("download: ", filename)
r = requests.get(inception_pretrain_model_url, stream=True)
with open(filepath, 'wb') as f:
for chunk in r.iter_content(chunk_size=1024):
if chunk:
f.write(chunk)
print("finish: ", filename)
#解压文件
tarfile.open(filepath, 'r:gz').extractall(inception_pretrain_model_dir)
#模型结构存放文件
log_dir = 'inception_log'#打开这个通过命令提示符,用tensorboard查看,tensorboard查看并可视化
if not os.path.exists(log_dir):
os.makedirs(log_dir)
#classify_image_graph_def.pb为google训练好的模型
inception_graph_def_file = os.path.join(inception_pretrain_model_dir, 'classify_image_graph_def.pb')
#'classify_image_graph_def.pb'为inception-v3中训练好的一个模型
with tf.Session() as sess:
#创建一个图来存放google训练好的模型
with tf.gfile.FastGFile(inception_graph_def_file, 'rb') as f:
graph_def = tf.GraphDef()
graph_def.ParseFromString(f.read())
tf.import_graph_def(graph_def, name='')
#保存图的结构
writer = tf.summary.FileWriter(log_dir, sess.graph)
writer.close()
运行后显示:
2.可视化结果(在tensorboard查看):代码中有备注
inception的描述V1-V4:https://blog.csdn.net/u010402786/article/details/52433324
3.利用下载的inception模型模型进行图像识别:
传入的2个文件:
代码:
# coding: UTF-8
import tensorflow as tf
import os
import numpy as np
import re
from PIL import Image
import matplotlib.pyplot as plt
#两个文件的预处理
# inception-v3是做1000个分类的,编号(字符串)是代表是哪些类,一共可以识别1000 个分类
class NodeLookup(object):
def __init__(self):#定义一个函数
label_lookup_path = 'inception_model/imagenet_2012_challenge_label_map_proto.pbtxt'
uid_lookup_path = 'inception_model/imagenet_synset_to_human_label_map.txt'
self.node_lookup = self.load(label_lookup_path, uid_lookup_path)#tf中读入文件的方法
def load(self, label_lookup_path, uid_lookup_path):
# 加载分类字符串n***********对应分类名称的文件
proto_as_ascii_lines = tf.gfile.GFile(uid_lookup_path).readlines()
uid_to_human = {}
#一行一行读取数据
for line in proto_as_ascii_lines:
#去掉换行符
line = line.strip('\n')#imagenet_synset_to_human_label_map.txt去掉最后的换行符
#按照‘\t’分割
parsed_items = line.split('\t')
#获取分类编号
uid = parsed_items[0] # n15092227,这个数字是代表某一类
#获取分类名称
human_string = parsed_items[1]
#保存编号字符串n*****与分类名称映射关系
uid_to_human[uid] = human_string
# 加载分类字符串n***********对应分类编号1-1000的文件
proto_as_ascii = tf.gfile.GFile(label_lookup_path).readlines()
node_id_to_uid = {}
for line in proto_as_ascii:
if line.startswith(' target_class:'):
#获取分类编号1-1000
target_class = int(line.split(': ')[1])
if line.startswith(' target_class_string:'):
#获取编号字符串n*****
target_class_string = line.split(': ')[1]
#保存分类编号1-1000与字符串n*****映射关系
node_id_to_uid[target_class] = target_class_string[1: -2]
#建立分类编号1-1000对应分类名称的映射关系
node_id_to_name = {}
for key, val in node_id_to_uid.items():
#获取分类名称
name = uid_to_human[val]
#建立分类编号1-1000到分类名称的映射关系
node_id_to_name[key] = name
return node_id_to_name
#传入分类编号1-1000返回分类名称
def id_to_string(self, node_id):
if node_id not in self.node_lookup:
return ''
return self.node_lookup[node_id]
# 创建一个图来存放google调整好的模型
with tf.gfile.FastGFile('inception_model/classify_image_graph_def.pb', 'rb') as f:
graph_def = tf.GraphDef()
graph_def.ParseFromString(f.read())
tf.import_graph_def(graph_def, name='')
with tf.Session() as sess:
softmax_tensor = sess.graph.get_tensor_by_name('softmax:0')
# 遍历目录
for root, dirs, files in os.walk('images/'):
for file in files:
#插入图片
image_data = tf.gfile.FastGFile(os.path.join(root, file), 'rb').read()#读入图片 file 图片的名字
#predictions = sess.run(softmax_tensor,{'DecodeJpeg/contents:0': image_data})#图片格式是jpg格式
predictions = sess.run(softmax_tensor,{'DecodeJpeg/contents:0': image_data})#图片格式是jpg格式
predictions = np.squeeze(predictions)#把结果转化为一维数据
#打印图片路径以及名称
image_path = os.path.join(root, file)
print(image_path)
#显示图片
img = Image.open(image_path)
plt.imshow(img)
plt.axis('off')
plt.show()
#排序
top_k = predictions.argsort()[-5:][::-1]
node_lookup = NodeLookup()
for node_id in top_k:
#获取分类名称
human_string = node_lookup.id_to_string(node_id)
#获取该分类的置信度,属于该分类的百分比,越高越属于
score = predictions[node_id]
print('%s (score=%.5f)' % (human_string, score))
print()#换行
结果:
Bug:(后来还是没有解决)
谷歌很多错误的解释说法(但是还是没解决):
- 版本不兼容
- 存在隐藏文件
有什么解决办法或者建议,恭请留言!