whisper 语音识别AI 声音To文字

whisper介绍

Whisper 是一个由 OpenAI 训练并开源的神经网络,功能是语音识别,能把语音转换为文字,在英语语音识别方面的稳健性和准确性接近人类水平。

1、Whisper支持语音转录和翻译两项功能并接受各种语音格式,模型中、英、法、德、意、日等主流语言上取得85%以上的准确率,完全符合工业准确率标准,未来有望打开商业化空间;

2、Whisper模型根据参数量和语言不同,共有9种版本,可适应不同使用者的需求。在中文语料测试下,模型在语音识别、语气识别、自动断句等方面表现出色,可满足各类使用场景需求;

C++版开源地址

https://github.com/ggerganov/whisper.cpp

.bin 模型下载地址

https://huggingface.co/ggerganov/whisper.cpp

python版开源地址

https://github.com/openai/whisper

桌面客户端 WhisperDesktop.exe 下载地址

https://github.com/Const-me/Whisper/releases

通过它直接调用模型

.pt 模型下载地址

链接:https://pan.baidu.com/s/1nj174s3tyHUAsazi4tHW0g

提取码:3ugi

猜你喜欢

转载自blog.csdn.net/u013628121/article/details/130066515