语音识别的难点 - 代码天地

语音识别的难点

其他 2018-09-23 05:07:14 阅读次数: 0

尽管语音识别的研究已有半个世纪了, 但现有的语音识别系统仍存在许多困难, 还远远达不到实用化的要求, 主要表现在:

(1)鲁棒性:目前的语音识别系统对环境条件的依赖性强, 要求保持测试条件和训练条件一致, 否则系统性能会严重下降。

(2)噪声问题：:现有的语音识别系统大多只能工作在安静的环境下, 一旦在噪声环境下工作, 讲话人产生情绪或心理上的变化, 导致发音失真、发音速度和音调改变, 即产生Lombard 效应或Loud 效应。常用的抑制噪声的方法, 可以概括为四个方面:谱减法、环
境规整技术、不修正语音信号而是修正识别器模型使之适合噪声、建立噪声模型。

(3)语音识别基元的选择:如何根据存贮空间和搜索速度的要求, 选择合适的识别单元, 如词、音节、音素。一般来讲, 要识别的词汇量越多, 所用的基元应越小越好。

(4)端点监测:研究表明, 即使在安静的环境下,语音识别系统一半以上的识别错误来自端点监测器。提高端点检测技术的关键在于寻找稳定的语音参数。

猜你喜欢

转载自blog.csdn.net/baidu_31437863/article/details/82807224

语音识别的难点

语音识别的技术

语音识别的流程

语音识别的资料

在线语音识别的软件

语音识别的技术原理

语音识别的深度学习

命名实体识别的难点与现状

情感语音识别的入门解析

语音识别的发展过程

语音识别的技术原理是什么？

华为HiAI语音识别的集成与使用

百度语音识别的要求-18/04/01

Android 轻松实现语音识别的完整代码 (转)

关于端到端语音识别的笔记

语音识别的基础知识与CMUsphinx介绍

一个Nuance 的语音识别的例子

语音识别的发展趋势及主要模型

人工智能 - 语音识别的技术原理是什么

使用讯飞语音识别的空指针错误

Android华为HiAI语音识别的集成与使用

基于语音识别的自然语言生成技术

语音识别（五）——Mel-Frequency Analysis, FBank, 语音识别的评价指标, 声学模型进阶

图像识别的技术难点和突破，你掌握吗？

C++使用SAPI实现语音合成和语音识别的方法和代码

Python实现人脸识别，并用语音提示识别的结果

一段讯飞、百度等语音识别API无法识别的语音最终解决办法

Android App开发语音处理之系统自带的语音引擎、文字转语音、语音识别的讲解及实战（超详细附源码）

Unity使用语音识别的字符串匹配算法

从声学模型算法角度总结 2016 年语音识别的重大进步

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)