说话人识别开集open-set和闭集close-set的区别

先引用知乎上 @LEON晋 大神解释的说话人识别对说话人准确率判断的两个评分标准:

在一批本该全部正确(TRUE)的列表中出现几个没识别出正确的语音,这个就是错误拒识FR(False Rejection),是Miss的;在一批本该全部错误(Flase)的列表中出现了几个没识别出错误的语音,就是错误的语音被认为对了,FA(False Acceptance),是Flase Alarm的。然后各自占的比例:FR = Miss / Total_TRUE;FA= False Alarm/ Total_False,

对说话人识别准确率EER的理论:EER

开始说说开集open-set和闭集close-set是啥:

声纹识别(说话人识别)需要三个数据,训练,注册和测试。

训练用的数据是普遍人(并不是准备使用该说话人识别系统的人)的语音数据。

一般注册和测试是用同一个人(目标)不同的语音

开集 我自己个人理解是open-set,就是测试的人没在模型上注册他们的声纹就去测试了,意思就是,在识别系统中没有该说话人的语音特征,但他硬要去挑战说话人识别系统的权威,去看看该系统是不是很聪明。如大大们所说的,看系统是否能把他给拒了。

判断是否在注册集中也像他们所说的,设个 threshold, 若大于则说明该人注册过了,在话语集中,小于则在集外。 FA的不变或增加

闭集 就是注册和测试是用同一个人(目标)不同的语音,直接做1:N或者1:1的说话人识别,你们都很熟悉的就是闭集啦!



猜你喜欢

转载自blog.csdn.net/robingao1994/article/details/79918779