AI ＞语音识别开源项目列举 - 代码天地

AI ＞语音识别开源项目列举

企业开发 2023-07-28 19:37:24 阅读次数: 0

名称	所属开发机构	使用场景	优缺点	技术特点	占有率	描述
CMU Sphinx	卡内基梅隆大学	嵌入式设备、服务器应用	优点：可用于嵌入式设备和服务器应用。缺点：准确率相对较低，适用范围有限。	- 支持多种语言模型和工具。- 适用于嵌入式设备和服务器应用。	中等	CMU Sphinx 是一个开源的语音识别系统，适用于嵌入式设备和服务器应用。它提供了多种语言模型和工具，但准确率相对较低，适用范围有限。
DeepSpeech	Mozilla	多平台应用、语音到文本转换、语音识别	优点：支持多平台。缺点：训练过程较慢，模型较大。	- 基于深度学习技术。- 支持多平台。	低	DeepSpeech 是由 Mozilla 开发的开源语音识别引擎，基于深度学习技术，支持多平台应用。然而，由于深度学习模型的训练过程较慢，且模型较大，可能需要较高的计算资源和时间。
Kaldi	Kaldi 团队	学术界和工业界、大规模语音识别	优点：强大的语音识别工具包。缺点：学习曲线较陡峭。	- 强大的语音识别工具包。	中等	Kaldi 是一个强大的语音识别工具包，广泛应用于学术界和工业界，提供了多种现代的语音识别算法。然而，由于其复杂性，可能需要一定的学习曲线来使用。
OpenSeq2Seq	NVIDIA	端到端语音识别、大规模语音识别	优点：支持端到端语音识别。缺点：需要较高的计算资源。	- 基于 Tensorflow 的端到端语音识别系统。- 支持大规模语音识别。	低	OpenSeq2Seq 是由 NVIDIA 开发的开源项目，支持端到端语音识别，适用于大规模语音识别任务。然而，由于端到端系统通常需要较高的计算资源，可能不适用于资源受限的设备。
Julius	未指定	快速实时的大词汇量连续语音识别	优点：快速实时，适用于大词汇量识别。缺点：开发机构未指定。	- 快速实时的大词汇量连续语音识别。	低	Julius 是一种快速实时的大词汇量连续语音识别引擎，适用于多种语言，特别适用于需要实时性和大词汇量识别的场景。然而，其具体开发机构未指定。
Pocketsphinx.js	卡内基梅隆大学	在浏览器中运行的语音识别	优点：可在浏览器中运行。缺点：准确率相对较低。	- 在浏览器中运行的语音识别。	低	Pocketsphinx.js 是 CMU Sphinx 的 JavaScript 端口，可在浏览器中运行语音识别。它提供了一种在浏览器中实现语音识别的方法，但准确率可能相对较低。
Vosk	未指定	离线语音识别	优点：支持离线语音识别。缺点：开发机构未指定。	- 支持离线语音识别。	未知	Vosk 是一个适用于离线语音识别的开源工具包，支持多种语言和平台。然而，其具体开发机构未指定。

请注意，这些信息可能随着时间的推移而有所变化，建议在使用这些开源项目时查阅它们的官方网站或开发社区以获取最新信息。同时，这里的"占有率"是根据目前提供的信息估计的，并不是准确的市场份额数据。

抖动的声音：dilo_Abel

dilo_Abel的个人空间-dilo_Abel个人主页-哔哩哔哩视频

猜你喜欢

转载自blog.csdn.net/DL_62532/article/details/131892217

AI ＞语音识别开源项目列举

AI ＞图像识别的开源项目列举

AI ＞语音识别书籍推荐

语音识别|中文语音识别开源数据集整理

语音开源项目优选：免费配音网站15.ai

AI大语音（一）——语音识别基础

语音识别技术(AI VQ HMM)，语音样本及开源工具 Kaldi等，双麦阵列

(二十)AI同声传译、AI语音识别、AI文本翻译、AI实时翻译、AI文本转语音、AI声纹识别、AI男女声识别

行人属性识别开源项目

人脸识别开源项目--insightface

OCR识别开源项目对比

可以白嫖的语音识别开源项目whisper的搭建详细过程 | 如何在Linux中搭建OpenAI开源的语音识别项目Whisper

本地语音识别开源软件pocketsphinx调试总结

语音识别开源框架 openAI-whisper

Azure AI 服务之语音识别

百度AI-语音识别

whisper 语音识别AI 声音To文字

AIOpens：AI开源项目汇集

AIOpen: AI开源项目汇集

语音识别|中文语音识别开源数据集整理（持续更新）

Python百度AI语音识别——文字转语音

百度AI的语音识别与语音合成

AI之语音转写项目实践

这个 AI 开源项目要火！涵盖 OCR、人脸检测、NLP、语音合成多方向

人工智能（AI）入门---傅里叶语音识别项目（全家福）

人工智能（AI）入门---傅里叶语音识别项目（发端）

AI识别照片是谁，人脸识别face_recognition开源项目安装使用 | 机器学习

OpenHarmony AI图像识别开发—基于润和Hi3516开发套件

AI识别（Springboot+AI）二

AI识别（Springboot+AI）一

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)