声纹识别
声纹识别关心的“ 谁在说”,用于解决生物 身份确认和识别;而语音识别关心的“说了什么”,用于解决对说话内容的识别。
1. 理论
1.1 声纹识别基础
-
扫描二维码关注公众号,回复: 13041096 查看本文章
1.2 声纹识别算法
1.3 声纹识别数据介绍
2. 资源
2.1 数据(中文/英文)
(1) 中文数据集
SLR33
SLR85
SLR82
AISHELL-2
SLR18
(2)国外数据集
Voxceleb2
可参考点击进行下载(注意:解压方式)
配套论文:论文分享 VoxCeleb2:Deep Speaker Recognition
2.2 工具
Kaldi
-
Python + kaldi
PYTORCH-KALDI语音识别工具包
TensorFlow
TensorFlow-based Deep Speaker
PyTorch
PyTorch-based Deep Speaker
Keras
2.3 资源汇总
- 详解音频编解码的原理、演进和应用选型等——很全面的音频相关系列连载!
- 语音识别(八)——声纹识别, 地理
- 小白声纹识别(说话人识别)探索
- 20190510 语音识别资源整理
- iamxiaoyubei /Voice-Tech-Study
- kaldi/语音识别ASR/声纹识别SRE/资源汇总——总结了很多综合性的语音识别/声纹识别资源
声纹识别的应用
- 声纹识别的应用实践——李博士的知乎专栏,写的不错!
- Leon晋声纹/ASR/diarization/Kaldi粉——可以看大佬在知乎的回答,说不定就有新的收获
声纹识别学习路径
- 说话人识别/声纹识别学习路径的资料整理,从零学声纹识别——简直牛逼轰轰!如果有时间,又想系统的学习的话,可以参考这个学习路径:GMM-UBM -> JFA -> Ivector-PLDA -> DNN embeddings -> E2E
2.4 声纹识别大牛
3. 实战:理论到代码
数据
指标
- 基础指标:FAR、FRR
人脸识别模型评价指标:完整梳理 - ERR
声纹识别 如何获取最佳效果的阈值(通过计算ERR)?
测试
- Kaldi项目测试(1)顺利提取特征、计算相似度分数
代码
papers with code: Speaker Verification +论文+代码!!!
声纹识别项目
-
Python + tensorflow:声纹识别综述+一个简易的tensorflow实现的模型(https://github.com/RDShi/voiceprint)
-
Python + Keras:基于Kersa实现的中英语音声纹识别
-
使用tensorflow和densenet神经网路实现语谱图声纹识别,即说话人识别
配套的 github地址:https://github.com/jcfszxc/Project
参考: