声纹识别·总章

其他 2021-03-30 19:32:51 阅读次数: 0

声纹识别关心的“ 谁在说”，用于解决生物 身份确认和识别；而语音识别关心的“说了什么”，用于解决对说话内容的识别。

1. 理论

1.1 声纹识别基础

1.2 声纹识别算法

1.3 声纹识别数据介绍

声纹识别常用数据集简介

2. 资源

2.1 数据（中文/英文）

（1）中文数据集
SLR33
SLR85
SLR82
AISHELL-2
SLR18

（2）国外数据集
Voxceleb2
可参考点击进行下载（注意：解压方式）
配套论文：论文分享 VoxCeleb2：Deep Speaker Recognition

2.2 工具

Kaldi

kaldi 声纹识别·资源汇总
Kaldi 声纹识别·总章

Python + kaldi
PYTORCH-KALDI语音识别工具包

TensorFlow

TensorFlow-based Deep Speaker

PyTorch

PyTorch-based Deep Speaker

Keras

Speaker Recognition

2.3 资源汇总

详解音频编解码的原理、演进和应用选型等——很全面的音频相关系列连载！
语音识别（八）——声纹识别, 地理
小白声纹识别（说话人识别）探索
20190510 语音识别资源整理
iamxiaoyubei /Voice-Tech-Study
kaldi/语音识别ASR/声纹识别SRE/资源汇总——总结了很多综合性的语音识别/声纹识别资源

声纹识别的应用

声纹识别的应用实践——李博士的知乎专栏，写的不错！
Leon晋声纹/ASR/diarization/Kaldi粉——可以看大佬在知乎的回答，说不定就有新的收获

声纹识别学习路径

说话人识别/声纹识别学习路径的资料整理,从零学声纹识别——简直牛逼轰轰！如果有时间，又想系统的学习的话，可以参考这个学习路径：GMM-UBM -> JFA -> Ivector-PLDA -> DNN embeddings -> E2E

2.4 声纹识别大牛

王赟
王泉——这个很强大，有很多理论以及工具的介绍，以及王泉老师维护的项目，以及新书：《声纹技术：从核心算法到工程实践》

3. 实战：理论到代码

数据

语音库的分析与评价
 音频质量的评价方法

指标

基础指标：FAR、FRR
人脸识别模型评价指标：完整梳理
ERR
声纹识别如何获取最佳效果的阈值（通过计算ERR）？

测试

Kaldi项目测试（1）顺利提取特征、计算相似度分数

代码

papers with code: Speaker Verification +论文+代码！！！

声纹识别项目

Python + tensorflow：声纹识别综述+一个简易的tensorflow实现的模型（https://github.com/RDShi/voiceprint）
Python + Keras：基于Kersa实现的中英语音声纹识别
【工程】深度说话人的应用及声纹识别系统的制作 (附完整代码与数据集)
使用tensorflow和densenet神经网路实现语谱图声纹识别,即说话人识别

配套的 github地址：https://github.com/jcfszxc/Project

参考：

猜你喜欢

转载自blog.csdn.net/Robin_Pi/article/details/108116794

声纹识别·总章

Kaldi 声纹识别·总章

声纹识别综述

声纹识别

声纹识别调研

声纹识别学习记录

声纹识别之xvector

声纹识别资源汇总

声纹识别技术的现状、局限与趋势

声纹识别技术简介——化繁为简的艺术

声纹识别之PLDA算法描述

AI_声纹识别综述

文本无关的声纹识别验证

声纹识别开源工具

声纹识别-1.绪论

声纹识别SDK-FreeSR

基于Kersa实现的声纹识别

使用Tensorflow实现声纹识别

使用PaddlePaddle实现声纹识别

kaldi 声纹识别·资源汇总

声纹识别--基础学习笔记

声纹识别与声源定位（一）

声纹识别与声源定位（二）

NeMo 声纹识别VPR-实战

声纹识别声纹司法鉴定必看

说话人识别/声纹识别学习路径的资料整理,从零学声纹识别

我对说话人识别/声纹识别的研究综述

小白声纹识别（说话人识别）探索

Tensorflow声纹识别说话人识别

声纹识别系统在市场中的机会和挑战

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)