深度学习语音分离|抽取必读论文、数据集、代码工具整理分享

    语音分离(Speech Separation)这个问题来自于“鸡尾酒会问题”,采集的音频信号中除了主说话人之外,还有其他人说话声的干扰和噪音干扰。语音分离的目标就是从这些干扰中分离出主说话人的语音。

    根据干扰的不同,语音分离任务可以分为三类:

    1、当干扰为噪声信号时,可以称为“语音增强”(Speech Enhancement)
2、当干扰为其他说话人时,可以称为“多说话人分离”(Speaker Separation)
3、当干扰为目标说话人自己声音的反射波时,可以称为“解混响”(De-reverberation)

    由于麦克风采集到的声音中可能包括噪声、其他人说话的声音、混响等干扰,不做语音分离、直接进行识别的话,会影响到识别的准确率。因此在语音识别的前端加上语音分离技术,把目标说话人的声音和其它干扰分开就可以提高语音识别系统的鲁棒性,这从而也成为现代语音识别系统中不可或缺的一环。

    基于深度学习的语音分离,主要是用基于深度学习的方法,从训练数据中学习语音、说话人和噪音的特征,从而实现语音分离的目标。本资源整理了基于深度学习语音分离和抽取(Speech Separation and Extraction)相关的tutorials、算法及最新的研究论文,公开数据集,代码和工具,需要的朋友自取。

    资源整理自网络,源地址:

    https://github.com/gemengtju/Tutorial_Separation

    文中论文等资源下载链接,见源地址。

目录

资源列表

往期精品内容推荐

ACM金牌导师1个月带你一起魔鬼刷爆算法题!

2020年新书-《机器学习算法入门》免费pdf分享

历史最全图像/视频去模糊化精选论文整理分享

机器学习从入门到进阶所需学习资料-包括书、视频、源码

2019年新书-Marc Peter Deisenroth《机器学习基础》-免费分享

Graph Neural Network(GNN)最全资源整理分享

Tensorflow实现的深度NLP模型集锦

免费中文书籍-《神经网络与深度学习》中文版推荐

从入门到精通-Tensorflow深度强化学习课程

斯坦福NLP组-2019-《CS224n: NLP与深度学习》-分享

免费教材-《数据科学基础-2018》最新版下载

<好书推荐> -《Pro Deep Learning with TensorFlow》分享

猜你喜欢

转载自blog.csdn.net/lqfarmer/article/details/109101549
今日推荐