几行代码就搞定一个文字识别功能，同时还能转换成语音，畅快！

其他 2018-12-16 11:10:53 阅读次数: 0

前几天想把一篇不错的文章保存下来，无奈是图片的，于是想利用python把图片中的文字识别出来

实现的方式还是挺多的，这里介绍下百度的AI开放平台，毕竟大公司，感觉识别的精度会高点，同时相信他们的算法也会不断优化，我等小菜鸟只要会用就可以啦。

一些准备

使用百度的AI开放平台，首先你得有个百度的开发者账号，相信你有百度云的话应该都会有，没有的话简单注册一下就可以了。

然后进入控制台选择人工只能-文字识别去创建个应用，这样就会生成对应的AppID，API Key和Secret Key，调用百度API的时候需要用到。

几行代码就搞定一个文字识别功能，同时还能转换成语音，畅快！

几行代码就搞定一个文字识别功能，同时还能转换成语音，畅快！

可以看到，作为开发者你每天有一定的免费调用次数，但如果不满足需求，可能就需要付费啦。

几行代码就搞定一个文字识别功能，同时还能转换成语音，畅快！

正式编码

下面简单介绍下编码过程，具体可以参考百度的官方文档

百度不但提供API，还贴心的准备了热门语言的SDK，包括java,pyhton,c#等等，其实本质还是调用API。

这里以python为例，首先安装python的SDK：

pip install baidu-aip

看了下文档的demo，其实还是比较简单的，几行代码就搞定了，文章最后贴自己的源码吧。

在浏览文档的时候发现，百度还提供了一些列的识别，包括身份证，银行卡，营业执照等固定的模板，同时还可以识别表格和自定义模板文字识别，在实际业务场景中还是挺有用处的。

此外还有一些其他AI相关的技术，有兴趣的小伙伴可以自行看下。

最后贴一下自己写的一个小demo，识别图片中的文字后，又通过语音合成转成了mp3的音频：

几行代码就搞定一个文字识别功能，同时还能转换成语音，畅快！

总结

几行代码搞定的快感依旧屡试不爽。

几行代码就搞定一个文字识别功能，同时还能转换成语音，畅快！

猜你喜欢

转载自blog.csdn.net/sinat_38682860/article/details/84960698

几行代码就搞定一个文字识别功能，同时还能转换成语音，畅快！

文字怎么转换成语音

怎么把文字转换成语音

快速的将文字转换成语音，具体功能如何实现

vue项目实现文字转换成语音播放功能

文字如何在线转换成语音文件

准备好的文字转换成语音的方法

怎么将文字转换成语音？

在线文字怎么转换成语音的形式？

文字转换成语音的简单方法，一起来看看吧！

图片文字转换成语音的方法一览

python将文本转换成语音的代码

如何把文字转换成语音，文字转语音转换器能帮你

如何将文字转换成语音？文字转语音哪个工具好

怎么把文字转换成语音？文字转语音方法分享

如何将自己输入的文字转换成语音？这里的方法超级简单

文字转换成语音，这里有简单的方法

怎样快速将文字转换成语音？这种操作很简单

怎么把文字转换成语音？教你几个方法，超级简单

使用Python将文本转换成语音？

一分钟就可以轻松将文字转换成语音，简单方法讲解

视频语音怎么转换成文字？分享2个视频语音转文字的方法

IBM的语音识别（IBM speech to text 语言转换成文字）

怎样识别语音文件转换成文字形式

怎样识别MP3语音转换成文字形式

AR ———正方形图片识别转换成一个标记

一个把文件转换成代码数组的小工具（源代码）

怎么把文本转换成语音？这些转换小妙招了解下

float数组转换成uint8_t数组，用于串口发送（一个函数搞定）

一个将汉字转换成汉语拼音的python库的代码

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)