语音识别（三）

其他 2019-03-01 13:30:21 阅读次数: 0

潘多拉魔盒

参考：http://www.julyedu.com/video/play/104/916

语音识别系统(1990~2010)

20年间，系统做了没有变化，但是有四个重要的技术提升了识别率

1.上下文有关模型

考虑five和nine两个单词，ai（f，v）和ai（n,n）不一样，英文的音素有50个，

若每个音素都考虑上下文，则状态数目会爆炸（50^3），但是ai（m,n）和ai（n,n）可能一样

2.区分式训练

EM算法是最大似然估计，区分式训练通过调整目标函数让P(X|W)大，同时让P(X|W1)小，W1为W的竞争者

3.说话人适应

说话人相关训练

说话人适应

说话人适应训练

4.二次打分

解码器先用Bigram语言模型识别得到n-best list或者lattice,再用高级的语言模型代替Bigram对这些句子重新打分

猜你喜欢

转载自blog.csdn.net/wangzhanxidian/article/details/84679750

语音识别（三）

语音识别系列︱paddlespeech的开源语音识别模型测试（三）

语音识别算法原理文档整理（三）

语音识别学习笔记（三）【动态时间归正的识别技术】

语音识别

语音识别与语音合成

语音识别语音合成

端到端语音识别（三） Sequence to Sequence and Attention

语音识别笔记 (六) 多遍解码、三音子模型

语音识别（三）：基于傅里叶变换的频率域滤波

基于深度学习方法的语音识别研究（三）

ROS 科大讯飞语音（三）识别篇

微软语音识别下，对象&接口（三）

语音识别（三）——声学模型, 解码器技术

语音识别之HTK入门（三）训练文件准备

论语音识别三大关键技术

[语音识别] 单音素、三音素、决策树

百度API调用（三）——语音识别

语音识别之Listen, Attend and Spell（LAS）模型详解——语音信号处理学习（三）

语音合成和语音识别

语音合成以及语音识别

语音识别一、语音识别介绍

[语音识别] 01 语音识别概述

【语音识别】基于keras的简易语音识别

三、Windows10平台下Unity3d的语音识别——听写识别

研究生语音识别课程作业记录（三）非特定人孤立词识别

语音识别（五）：声音识别

情感语音识别---识别网络

中文语音识别

语音识别 - 损失函数

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)