阿里开源自主研发的 DFSMN 语音识别模型，引谷歌论文引用 - 代码天地

阿里开源自主研发的 DFSMN 语音识别模型，引谷歌论文引用

其他 2018-06-15 05:17:32 阅读次数: 2

近日，阿里巴巴达摩院机器智能实验室语音识别团队，推出了新一代语音识别模型—— DFSMN，不仅被谷歌等国外巨头在论文中重点引用，更将全球语音识别准确率纪录提高至 96.04%（基于世界最大的免费语音识别数据库LibriSpeech）。

阿里在GitHub平台上开源了自主研发的DFSMN语音识别模型

这支平均年龄只有 30 岁的团队还宣布，即日起向全世界企业与个人开源此次打破全球语音识别纪录的 DFSMN 模型，使全球开发者都能共享这一成果，共同推进人工智能技术的发展。这也使 DFSMN有望继传统的 LSTM 模型后，成为全球语音识别领域最主要的声学识别模型之一，全球语音识别准确率也有望总体提高 10%。

著名语音识别专家，西北工业大学教授谢磊表示：「阿里此次开源的 DFSMN 模型，在语音识别准确率上的稳定提升是突破性的。是近年来深度学习在语音识别领域最具代表性的成果之一。对全球学术界和AI技术应用都有巨大影响。」

语音识别是人机交互中的核心技术，在智能音响、智能家居、机器人及自动驾驶等领域都有广泛应用。在刚刚结束的云栖大会武汉峰会上，装有 DFSMN 语音识别模型的「AI收银员」在与真人店员的 PK 中，在嘈杂环境下准确识别了用户的语音点单，在短短 49 秒内点了 34 杯咖啡。此外，装备这一语音识别技术的自动售票机也已在上海地铁「上岗」。

DFSMN 语音识别模型，对比目前业界使用最为广泛的 LSTM 模型，训练速度更快、识别准确率更高。采用全新 DFSMN 模型的智能音响或智能家居设备，相比前代技术深度学习训练速度提到了 3 倍，语音识别速度提高了 2 倍。

Github 链接：

https://github.com/alibaba/Alibaba-MIT-Speech

猜你喜欢

转载自blog.csdn.net/jacke121/article/details/80645404

阿里开源自主研发的 DFSMN 语音识别模型，引谷歌论文引用

阿里开源自研语音识别模型 DFSMN，准确率高达96.04%

重磅！阿里开源自研语音识别模型DFSMN，准确率高达96.04%

重磅！MaxCompute助力阿里开源自研语音识别模型DFSMN，准确率高达96.04%

语音识别|基于CNN+DFSMN（完整版：向量+有步长因子）的声学模型实现及代码开源（tensorflow）

语音识别|基于CNN+DFSMN（简化版：标量+无步长因子）的声学模型实现及代码开源（keras）

DFSMN系列

基于DFSMN-CTC及CTC-CE联合训练的声学模型

开源自主导航小车MickX4（四）底盘URDF模型

阿里开源自研工业级稀疏模型高性能训练框架 PAI-HybridBackend

DFSMN-SAN WITH PERSISTENT MEMORY MODEL FOR AUTOMATIC SPEECH RECOGNITION翻译

语音识别系列︱paddlespeech的开源语音识别模型测试（三）

语音识别系列︱paddlehub的开源语音识别模型测试（二）

OpenAI 开源语音识别模型 Whisper

Whisper OpenAI开源语音识别模型

开源自主无人机软件平台—Prometheus

开源自动语音识别系统wav2letter (附实现教程)

OpenAI 开源语音识别模型 Whisper 初体验

.Net 使用OpenAI开源语音识别模型Whisper

阿里 90 后科学家研发，达摩院开源新一代 AI 算法模型

新手入门深度学习做语音识别？谷歌AIY也是开源

AutoML大提速，谷歌开源自动化寻找最优ML模型新平台

阿里去年新增12亿行代码；即将开源自研科学计算引擎、图学习框架；行人重识别算法斩获世界第一 | 周博通

阿里去年新增12亿行代码；即将开源自研科学计算引擎、图学习框架；行人重识别算法斩获世界第一 | 周博通...

淘宝自主研发的海量数据库OceanBase开源

腾讯自主研发动画组件PAG开源

开源自主导航小车MickX4（九）基于move_base 的自主导航框架

开源自主导航小车MickX4（一）ROS底盘硬件

开源自主导航小车MickX4（十）总结

开源自主导航小车MickX4（三）底盘ROS节点

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)