语音识别的发展趋势及主要模型

其他 2019-03-07 01:00:22 阅读次数: 0

以前的语音识别系统基于高斯混合模型（Gaussian Mixture Model, GMM）和隐马尔可夫模型（Hidden Markov Model），即 GMM-HMM 模型。

发展到端对端

目前的端到端系统基本上基于两个框架，

一个是 CTC（Connectionist Temporal Classification）框架，

一个是基于注意力机制的 seq2seq 框架。

CTC典型的有百度的deepspeech2, 科大讯飞DFCNN

基于注意力机制seq2seq:谷歌的LAS

2018年阿里开源自研语音识别模型 DFSMN，准确率高达96.04%，识别率最高

开源地址：https://github.com/alibaba/Alibaba-MIT-Speech

猜你喜欢

转载自blog.csdn.net/yang_daxia/article/details/84350047

语音识别的发展趋势及主要模型

车牌识别行业发展趋势

语音识别的发展过程

2023年企业级存储主要发展趋势

单兵态势感知技术和装备的主要发展趋势

银行卡识别OCR技术的未来发展趋势

图像识别技术的应用及发展趋势

表格检测识别技术面临的挑战和发展趋势

IT发展趋势杂谈

家电的发展趋势

前端的发展趋势！

云计算的快速发展，未来主要的发展趋势是什么？

语音识别的难点

语音识别的技术

语音识别的流程

语音识别的资料

未来商业发展趋势 !

物联网——发展趋势

解读Facebook发展趋势

IT几个发展趋势总结

PCB发展趋势简介

未来DSP发展趋势

短信群发的发展趋势

Python介绍、发展趋势

前端开发的发展趋势

java历史与发展趋势

SaaS发展趋势简述

跨境支付的发展趋势

软件测试发展趋势

TWS耳机发展趋势

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)