阿里开源自研语音识别模型 DFSMN，准确率高达96.04% - 代码天地

阿里开源自研语音识别模型 DFSMN，准确率高达96.04%

业界资讯 2018-06-09 08:07:10 阅读次数: 15

近日，阿里巴巴达摩院机器智能实验室开源了新一代语音识别模型DFSMN，将全球语音识别准确率纪录提高至96.04%。这一数据测试基于世界最大的免费语音识别数据库LibriSpeech。

对比目前业界使用最为广泛的LSTM模型，DFSMN模型训练速度更快、识别准确率更高。采用全新DFSMN模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了3倍，语音识别速度提高了2倍。

著名语音识别专家，西北工业大学教授谢磊表示：“阿里此次开源的DFSMN模型，在语音识别准确率上的稳定提升是突破性的，是近年来深度学习在语音识别领域最具代表性的成果之一，对全球学术界和AI技术应用都有巨大影响。”

语音识别技术一直都是人机交互技术的重要组成部分。有了语音识别技术，机器就可以像人类一样听懂说话，进而能够思考、理解和反馈。近几年随着深度学习技术的使用，基于深度神经网络的语音识别系统性能获得了极大的提升，开始走向实用化。基于语音识别的语音输入、语音转写、语音检索和语音翻译等技术得到了广泛的应用。

目前主流的语音识别系统普遍采用基于深度神经网络和隐马尔可夫（Deep Neural Networks-Hidden Markov Model，DNN-HMM）的声学模型，其模型结构如图 1所示。声学模型的输入是传统的语音波形经过加窗、分帧，然后提取出来的频谱特征，如 PLP， MFCC 和 FBK等。而模型的输出一般采用不同粒度的声学建模单元，例如单音素 (mono-phone)、单音素状态、绑定的音素状态 (tri-phonestate) 等。从输入到输出之间可以采用不同的神经网络结构，将输入的声学特征映射得到不同输出建模单元的后验概率，然后再结合HMM进行解码得到最终的识别结果。

项目地址：https://github.com/tramphero/kaldi

详情见阿里技术公众号。

猜你喜欢

转载自www.oschina.net/news/96897/ali-open-source-dfsmn

重磅！阿里开源自研语音识别模型DFSMN，准确率高达96.04%

阿里开源自研语音识别模型 DFSMN，准确率高达96.04%

重磅！MaxCompute助力阿里开源自研语音识别模型DFSMN，准确率高达96.04%

阿里开源自主研发的 DFSMN 语音识别模型，引谷歌论文引用

谷歌 ReCaptcha 系统被破解，机器语音验证准确率高达 85%

我，AI专家，模型检测COVID-19准确率高达97.5%，约吗

模型准确率accuracy

Python-基于卷积神经网络斑马线识别分类，准确率高达99%

提高模型准确率：组合模型

模型的准确率是0.75，ROC分数

笔记 - 模型评估：准确率评估

如何提升分类模型准确率

sklearn中分类模型评估指标（一）：准确率、Top准确率、平衡准确率

【智能AI】准确率97%的开源肺炎检测模型

基于主题策略的实体识别准确率优化

提高准确率CNN手写识别

(11) 数字识别4.0 准确率98

NLU中如何计算意图识别准确率

Google开源新AI模型，语音区分准确率92%创新高 | 论文+GitHub

8个提高机器学习模型的准确率的方法

提升机器学习模型准确率的考虑方向

模型的评估方法-准确率与混淆矩阵

人工智能之模型评估之准确率

深度学习提高模型准确率方法

谷歌新”蒸馏法“火了！模型准确率翻倍

为什么神经网络模型在测试集上的准确率高于训练集上的准确率？

高通称其终端语音识别准确率达95%

机器学习：有关分类模型的准确率、召回率、精确率介绍

数据预处理和模型架构是提高人脸识别模型准确率的关键

百度开源全新肿瘤识别AI算法，准确率超专业病理医生

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)