声纹识别·总章


声纹识别关心的“ 谁在说”,用于解决生物 身份确认和识别;而语音识别关心的“说了什么”,用于解决对说话内容的识别。

1. 理论

1.1 声纹识别基础

1.2 声纹识别算法

1.3 声纹识别数据介绍

声纹识别常用数据集简介

2. 资源

2.1 数据(中文/英文)

(1) 中文数据集
SLR33
SLR85
SLR82
AISHELL-2
SLR18

(2)国外数据集
Voxceleb2
可参考点击进行下载(注意:解压方式)
配套论文:论文分享 VoxCeleb2:Deep Speaker Recognition

2.2 工具

Kaldi

TensorFlow

TensorFlow-based Deep Speaker

PyTorch

PyTorch-based Deep Speaker

Keras

Speaker Recognition

2.3 资源汇总

  1. 详解音频编解码的原理、演进和应用选型等——很全面的音频相关系列连载!
  2. 语音识别(八)——声纹识别, 地理
  3. 小白声纹识别(说话人识别)探索
  4. 20190510 语音识别资源整理
  5. iamxiaoyubei /Voice-Tech-Study
  6. kaldi/语音识别ASR/声纹识别SRE/资源汇总——总结了很多综合性的语音识别/声纹识别资源

声纹识别的应用

声纹识别学习路径

2.4 声纹识别大牛

  • 王赟
  • 王泉——这个很强大,有很多理论以及工具的介绍,以及王泉老师维护的项目,以及新书:《声纹技术:从核心算法到工程实践》

3. 实战:理论到代码

数据

语音库的分析与评价
音频质量的评价方法

指标

测试

  • Kaldi项目测试(1)顺利提取特征、计算相似度分数

代码

papers with code: Speaker Verification +论文+代码!!!

声纹识别项目

  1. Python + tensorflow:声纹识别综述+一个简易的tensorflow实现的模型https://github.com/RDShi/voiceprint

  2. Python + Keras:基于Kersa实现的中英语音声纹识别

  3. 【工程】深度说话人的应用及声纹识别系统的制作 (附完整代码与数据集)

  4. 使用tensorflow和densenet神经网路实现语谱图声纹识别,即说话人识别

    配套的 github地址:https://github.com/jcfszxc/Project

参考:

  1. 语音识别(八)——声纹识别, 地理
  2. 声纹识别知识整理

猜你喜欢

转载自blog.csdn.net/Robin_Pi/article/details/108116794