语音识别学习笔记 - 代码天地

语音识别学习笔记

企业开发 2023-12-16 23:16:50 阅读次数: 0

目录

开源的语音识别项目

端到端的多说话人语音识别序列化训练方法简介

新一代 Kaldi: Two-pass 实时语音识别

开源的语音识别项目

有哪些语音识别的开源项目？ - 知乎

端到端的多说话人语音识别序列化训练方法简介

端到端的多说话人语音识别序列化训练方法简介 - 知乎

2.2 基于排列不变性训练Permutation Invariant Training (PIT)的多说话人语音识别
所谓排列不变性训练是在AED的基础之上，添加多个output分支（通常支持几个人就有几个分支），文本序列和输出序列经过排列组合，两两计算损失，如图1（b）所示。

2.3 基于SOT的多说话人语音识别
SOT方法网络结构与AED完全相同，只有一个output分支，不同的是标签序列化方式。SOT引入了一个新标签speaker change<sc>，用于标记上下文中说话人的改变，如图1(c,d)所示，标签的生成可以简单的以说话人出现的顺序作为依据，依次序列化，碰到说话人切换就添加一个<sc>特殊标签，损失依然采用交叉熵。这样一个output就能输出多个说话人识别结果，实现简单，效果提升明显。

新一代 Kaldi: Two-pass 实时语音识别

2nd-pass: 使用一个非流式模型。当 1st-pass 检测到一个 endpoint 之后，把上一个 segment 的音频送给非流式模型解码，然后把结果做为这个 segment 最终的结果.

Two-pass 既可以结合流式模型延迟小的优点，又可以利用非流式模型识别率高的优点。

新一代 Kaldi: Two-pass 实时语音识别 - 知乎

猜你喜欢

转载自blog.csdn.net/jacke121/article/details/134633552

语音识别学习笔记

学习笔记：语音识别 === 杂记

语音识别学习笔记（一）【概述】

K210学习笔记——语音识别

语音识别学习笔记（三）【动态时间归正的识别技术】

语音识别学习笔记：(一)百度语音识别Demo编译

语音识别学习记录

物联网外设学习笔记-语音识别模块

语音识别技术自学笔记

语音识别的深度学习

python 语音识别学习（1）

语音识别学习笔记（二）【基于矢量量化的识别技术】

基于深度学习的中文语音识别系统框架学习笔记

《语音信号处理》语音识别章节读书笔记

讯飞语音识别配置笔记

语音识别技术学习：CMU Sphinx

语音识别学习记录 [kaldi的chain model]

语音识别学习记录 [kaldi中的openfst]

如何用深度学习进行语音识别

语音识别实践——深度学习训练准则

深度学习在语音识别中的应用

【IOT】语音识别相关知识学习

ROS Melodic语音识别学习（二）

深度学习-语音识别实战(Python)

Keras深度学习实战（41）——语音识别

深度学习语音识别教程

深度学习在语音识别方面的应用

语音识别

语音识别与语音合成

语音识别语音合成

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)