看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

前面几天想看一个电影(至于什么电影就不说了),搜了半天没有中文字幕。

这种事情,你是不是也预定过!很痛苦,有声音和图形。但是你听不懂!嗯?

于是,我想想现在的科技这么发达,难道找不到音频转文字的软件吗!

于是我就搜了一下:

python学习群.png

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

这么贵!

好在这难道不了一个吃苦耐劳的程序员,在知乎某位大佬哪里找到了这个东西 !

IBM 爸爸的Speech to text

好了 ,大佬们,准备好你们的音频,以及Python,我们开始吧!!

第一步:

点击首页紫色的那个「Star for free in IBM Cloud」按钮,

注册IBM Cloud并登陆(注册不了的亲,记得科学上网)。

第二步:

添加服务,添加后是这样的:

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

点击现有服务,找到已有的服务。

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

点击服务名称查看详情。

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

看到页面下方显示服务凭证,且username和password都是加密符号表示。

点击右侧的「显示」,打开眼睛,

把username和password记下来

(复制到记事本里啦不要翻小本本了!)

好了,任务完成,我们可以把官网关掉了。

第三步:

安装SpeechRecognition包

打开cmd,输入pip install SpeechRecognition,耐心等待一会就安装成功了。

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

出现这个就安装成功了!

第四步:

打开Jupyter Notebook开始撸代码!

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

运行这一步发现报错了

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

原来要wav格式。

给大家推荐一个好用的神器:格式工厂。

音频视频文件转格式我都用它,方便小巧。

转格式后把引号里的内容改成1.wav就可以运行了。接着定义账号密码,

把引号里的XXX改成你自己的

IBM_USERNAME = 'XXXXXXXX'

IBM_PASSWORD= 'XXXXXXXX'

以及调用IBM的Speech to text。

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

我这2分多钟的音频大概运行了半分钟左右吧。

这个text,就是你音频转过来的文字了。

让我们来试试:

print(text)

看日本电影再也不怕看不懂了,6行Python代码轻松实现音频转文字

虽然准确率没有100%,但是也很厉害了!

它还支持很多语言。只要把language变量改成以下这些语言就可以了

  • ar-AR 阿根廷语
  • en-UK 英式英语
  • en-US 美式英语
  • es-ES 西班牙语
  • fr-FR 法语
  • ja-JP 日语
  • pt-BR 巴西葡萄牙语
  • zh-CN 中文

温馨提示:每个免费账户每个月都可使用100分钟,30天不活跃服务将会被删除

话不多说,我去看电影去了。

希望对你有帮助!

猜你喜欢

转载自blog.csdn.net/qq_41841569/article/details/81202201
今日推荐