深度学习语音分离|抽取必读论文、数据集、代码工具整理分享 - 代码天地

深度学习语音分离|抽取必读论文、数据集、代码工具整理分享

其他 2020-10-16 12:29:35 阅读次数: 0

语音分离（Speech Separation）这个问题来自于“鸡尾酒会问题”，采集的音频信号中除了主说话人之外，还有其他人说话声的干扰和噪音干扰。语音分离的目标就是从这些干扰中分离出主说话人的语音。

根据干扰的不同，语音分离任务可以分为三类：

1、当干扰为噪声信号时，可以称为“语音增强”（Speech Enhancement）
2、当干扰为其他说话人时，可以称为“多说话人分离”（Speaker Separation）
3、当干扰为目标说话人自己声音的反射波时，可以称为“解混响”（De-reverberation）

由于麦克风采集到的声音中可能包括噪声、其他人说话的声音、混响等干扰，不做语音分离、直接进行识别的话，会影响到识别的准确率。因此在语音识别的前端加上语音分离技术，把目标说话人的声音和其它干扰分开就可以提高语音识别系统的鲁棒性，这从而也成为现代语音识别系统中不可或缺的一环。

基于深度学习的语音分离，主要是用基于深度学习的方法，从训练数据中学习语音、说话人和噪音的特征，从而实现语音分离的目标。本资源整理了基于深度学习语音分离和抽取（Speech Separation and Extraction）相关的tutorials、算法及最新的研究论文，公开数据集，代码和工具，需要的朋友自取。

资源整理自网络，源地址：

https://github.com/gemengtju/Tutorial_Separation

文中论文等资源下载链接，见源地址。

目录

资源列表

往期精品内容推荐

ACM金牌导师1个月带你一起魔鬼刷爆算法题！

2020年新书-《机器学习算法入门》免费pdf分享

历史最全图像/视频去模糊化精选论文整理分享

机器学习从入门到进阶所需学习资料-包括书、视频、源码

2019年新书-Marc Peter Deisenroth《机器学习基础》-免费分享

Graph Neural Network（GNN）最全资源整理分享

Tensorflow实现的深度NLP模型集锦

免费中文书籍-《神经网络与深度学习》中文版推荐

从入门到精通-Tensorflow深度强化学习课程

斯坦福NLP组-2019-《CS224n: NLP与深度学习》-分享

免费教材-《数据科学基础-2018》最新版下载

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

猜你喜欢

转载自blog.csdn.net/lqfarmer/article/details/109101549

深度学习语音分离|抽取必读论文、数据集、代码工具整理分享

深度学习通信领域相关经典论文、数据集整理分享

最近几年-基于深度学习自然语言处理的推荐系统-必读论文整理分享

深度学习整理篇（二）语音分段和讲话人语音文件识别

深度学习语音识别教程

语音分离Sepformer

基于Python深度学习实现主动学习的关系抽取方法毕业论文+项目源码及数据集

深度学习语义分割(二)SegNet论文解读

深度学习语义分割(一)FCN论文解读

零样本或少样本相关论文、数据集、代码、资源整理分享

Speech Separation，语音分离详解——语音信号处理学习（七）

无监督对比学习（CL）最新必读经典论文整理分享

python 双声道语音分离

深度学习CV领域必读论文

深度学习论文整理

深度学习：文本检测数据集整理

机器学习PAI通过声音分辨男女(含语音特征提取相关数据和代码)

历史最全DL相关书籍、课程、视频、论文、数据集、会议、框架和工具整理分享

语音分享应用ios源码项目

深度学习语言增强

wav2letter++简介：深度学习语音识别系统

【基于pyAudioKits的Python音频信号处理项目（二）】深度学习语音识别

基于深度学习的全色图像锐化(Pansharpening)论文及代码整理

介绍| 深度学习数据集标注工具

语音分类任务（基于UrbanSound8K数据集）

【深度学习-语音分类】语种识别挑战赛Baseline

【深度学习-语音分类】婴儿啼哭声识别挑战赛Baseline

AAAI 2020论文分享：持续学习语义理解框架ERNIE 2.0

历史最全开放语音/音频数据集整理分享

数据抽取工具Kettle学习

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)