语音识别开源框架 openAI-whisper - 代码天地

语音识别开源框架 openAI-whisper

企业开发 2023-07-15 16:19:29 阅读次数: 0

Whisper 是一种通用的语音识别模型。它是OpenAI于2022年9月份开源的在各种音频的大型数据集上训练的语音识别模型，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。

GitHub - yeyupiaoling/Whisper-Finetune: 微调Whisper语音识别模型和加速推理，支持Web部署和Android部署

Whisper Webui - a Hugging Face Space by aadnk

微调Whisper语音识别模型和加速推理_夜雨飘零1的博客-CSDN博客

Openai-Whisper识别生成语音/视频字幕文件（支持自动翻译） - 哔哩哔哩

Whisper OpenAI开源语音识别模型_开源语音识别算法_Sanfor的博客-CSDN博客

conda create -n whisper python=3.9

conda activate whisper

pip install git+https://github.com/openai/whisper.git

whisper audio.mp3 --model medium --language Chinese

解决输出繁体中文不输出简体中文问题：

whisper --language Chinese --model large audio.mp3 --initial_prompt "以下是普通话句子"

就中文而言，Whisper各模型：

tiny 是没有做断句的，或者说，直接根据停顿断句
base 已经开始根据逻辑断句，但会出语法错误
small 已经很少语法错误，但断句水平却直线下降，很奇怪
medium 不仅能够完美的断句，还能判断语气

可以看出，飞书妙记给用户开放的转写能力大约在 tiny 到 base 之间（转写速度也在 tiny 左右，已经很快了）

值得指出的是，这里的对比，目的并不是比较二者的技术，否则对于飞书妙计相当的不公平，作为一款消费级应用，它不可能给用户跑medium等级的模型来做转写

对比的意义是，Whisper，作为一个开源模型，和消费级产品比起来怎么样？

答案是，完全可以替代，用 small 模型足以实现当下的免费体验了。

甚至，用 medium 以上的模型，可以用「时间」换「好得多的使用体验」

Whisper—通用的语音识别模型 - 知乎

https://www.bilibili.com/read/cv19254244

openai开源的whisper在huggingface中使用例子（语音转文字中文）_语音识别_qq_37401291-开发者创业生态社区

OpenAI 开源音频转文字模型 Whisper 尝鲜 - 少数派

Whisper—通用的语音识别模型 - 知乎

https://github.com/PaddlePaddle/PaddleSpeech/tree/develop/demos/speech_web

OpenAI 开源语音识别模型 Whisper - OSCHINA - 中文开源技术交流社区

OpenAI Whisper中文语音识别效果尝试和应用（一）_迷途的小朋友的博客-CSDN博客

GitHub - openai/whisper: Robust Speech Recognition via Large-Scale Weak Supervision

OpenAI Whisper中文语音识别效果尝试和应用（一）_迷途的小朋友的博客-CSDN博客

猜你喜欢

转载自blog.csdn.net/okyanxingkui/article/details/131726943

语音识别开源框架 openAI-whisper

OpenAI-whisper语音识别模型

使用openai-whisper 语音转文字

OpenAI 开源语音识别模型 Whisper

Whisper OpenAI开源语音识别模型

可以白嫖的语音识别开源项目whisper的搭建详细过程 | 如何在Linux中搭建OpenAI开源的语音识别项目Whisper

OpenAI 开源语音识别模型 Whisper 初体验

.Net 使用OpenAI开源语音识别模型Whisper

使用OpenAI的Whisper 模型进行语音识别

openai的whisper语音识别介绍

OpenAI Whisper 语音识别 API 模型使用 | python 语音识别

OpenAI Whisper中文语音识别效果尝试和应用（一）

OpenAI Whisper 语音识别模型部署及接口封装【干货】

OpenAI开源语音识别模型Whisper在Windows系统的安装详细过程

OpenAI开源全新解码器和语音识别模型Whisper-v3

基于OpenAI的Whisper构建的高效语音识别模型：faster-whisper

【openAI】Whisper如何高效语音转文字（详细教程）

OpenAI的人工智能语音识别模型Whisper详解及使用

OpenAI大动作：Whisper large-v3重塑语音识别技术

AI ＞语音识别开源项目列举

开源语音识别faster-whisper部署教程

OpenAI又一神器！Whisper 语音转文字手把手教程

语音识别|中文语音识别开源数据集整理

本地语音识别开源软件pocketsphinx调试总结

Whisper——部署fast-whisper中文语音识别模型

OpenAI Whisper论文笔记

whisper 语音识别AI 声音To文字

Whisper JAX 语音识别本地部署

语音识别模型whisper的参数说明

whisper 语音识别项目部署

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)