TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/haohaixingyun/article/details/82345912

TensorFlow 使用预训练好的卷积神经网络和循环神经网络(lstm)模型处理图片转文字(im2txt)

这是AI大智慧系列文章中的一篇关于图片转文字的一篇博文,介绍了如果使用已经训练好的模型。由于本模型的训练非常耗时间,GPU下可能需要 2weeks ,如果是浦东(普通)的笔记本,天呢,估计需要一年的时间(当然夸张了,一个月的时间还是需要的,根据美国team看 需要的时间大约是gup 时间的 10倍,也就是 20 weeks ,小半年时间了) 。

外界 ,至少我本人曾经以为AI能够处理的信息应该是巨大的,整理完这个模型的使用方法和模型本身内部的结构(解剖)就在内心充满了失望,悲剧的感情在整个身体流淌 。因为AI确实什么事情都干不了,恐怕这个时间要持续五年,十年,五十年 甚至更久远。单纯就从计算机技术来讲,区块链在上面提到的时间内更具有核弹威力 ,更通俗下讲就是更容易make money ,也更容易出成绩 。跟金融,财务 税收 ,发票 ,更简单的讲 跟fund or money 有关的领域 到可以用blockchin 。

找不到生活的方向,也找不到人生的意义,我抑郁。

先说明下 什么是图片转文字 ,道理非常简单 ,就是 根据图片上的信息 ,有算法 把该信息 提炼出来 转成文字 打印到平台上,如果是有能力做成小程序的话 ,也许意义会变的大一点,可是目前不具备这个能力 哼哼 抑郁

先上代码 code  地址 : https://github.com/haohaixingyun/im2txt-ethan-tensorflow

在本次实验中用到的 工具版本如下,

Python 3.6.2

TF : 1.3.0  ,更高版本1.10.0尝试过也是可以的 。

拿到code 和配置完成环境变量后 直接run run_inference.py 这个script 就 能够得到你想的结果 。

由于训练样本选择的原因 ,让本模型去识别一些不登大雅之堂的图片是办不到的 。在家里的laptop 上试验过 。其中一个重要的原因是本模型根本就没有哪些个特殊的单词 或是描述 。

两仪式

上面的图片预测出来是:

基本上搞不懂预测的是什么 ,不过好在是一个女孩 做在bed 上是可以明白的,泰迪熊是怎么来的 ,不知道

the good result :

猜你喜欢

转载自blog.csdn.net/haohaixingyun/article/details/82345912