端到端语音识别（一）概况 - 代码天地

端到端语音识别（一）概况

其他 2018-05-30 16:57:35 阅读次数: 0

传统方法的局限性[1]

HMM

Markovian Assumption

p (q t | q < t) = p (q t | q t - 1)

$p(q_t|q_{<t})=p(q_t|q_{t-1})$
转移概率只跟前一个时刻有关，无法对长时依赖性建模。

Conditional Independence Assumption

p (x t | x < t, q \leq t) = p (x t | q t)

$p(x_t|x_{<t}, q_{\leq t})=p(x_t|q_t)$
帧的生成概率只跟当前状态有关，跟历史状态和历史帧无关。

DNN

alignment

DNN的声学模型用来求输出状态对应的后验概率。需要用到GMM的对齐结果，来获得每一帧的label。首先需要GMM的对齐结果比较准确，其次是本身语音的边界不好界定，这样每一帧给一个指定label本身值得商榷。

Conditional Independence Assumption

和HMM类似，有独立性的假设。

Dict

词典和音素本身是handcrafted的

End to End实现方法[2]

end to end的语音识别主要有两种方法来实现
- 基于CTC的训练准则
CTC训练准则的引入抛弃了传统的HMM框架，输出的粒度可以到phone/charactor/word等。但是仍然有输出独立性的假设，使用的时候对于语言模型的依赖性比较强。
- 基于sequence to sequence和attention
虽然这种方式可以学习到word之间的关系，但是毕竟训练语料的transcription有限，所以额外的语言模型使用还是比较有必要。

end to end的语音识别框架在一定程度上减少了传统方法不合实际的假设，但是也存在训练困难的问题，为了取得比较好的效果，需要的训练语料也更多；而基于传统的DNN-HMM hybrid系统的方法可以得到更稳定的性能。

Reference

[1].End-to-End Speech Recognition Models
[2].Deep Speech 2 : End-to-End Speech Recognition in English and Mandarin

猜你喜欢

转载自blog.csdn.net/xmdxcsj/article/details/70300546

端到端语音识别（一）概况

语音合成vocoder（一）概况

Vue：（一）概况

Nginx一：概况

ADB(一)_概况了解

（一）秒杀系统概况

zigbee学习（一）总体概况

Dart入门（一）语言概况

Spring入门到精通一 ——Spring概况

项目一：查找Linux系统的基本概况

（一）架构篇之架构概况总览

CTS 源码分析(一) --CTS概况

CTS 源码分析(一)--CTS概况

一览前沿技术概况

人脸识别技术在公安实战中的应用概况

项目一任务一查找linux系统的基本概况

卷积神经网络学习笔记（一）：CNN概况

一句话概况osgi

GPON技术学习（一）--------GPON系统整体概况

用一张图概况Python学习

玩转数据结构 java描述一概况

一文概况JVM组成结构及功能详解

DPU 技术发展概况系列（一）什么是DPU

端到端语音识别（二） ctc

Deep Speech：端到端的语音识别

端到端语音识别时代

[语音识别] 10 端到端语音识别

目录概况

spring概况

CSS概况

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)