Unsupervised Domain Adaptation Via Domain Adversarial Training For Speaker Recognition

当评估数据集的领域与训练数据集的领域相似时,用于说话者识别的i-Vector方法取得了良好的性能。但是,在现实应用中,训练数据集和评估数据集之间始终存在不匹配,导致性能下降。为了解决这个问题,本文提出通过领域对抗训练来学习领域不变量和说话人鉴别性语音表征。具体的,在域对抗训练方法中,我们使用梯度反转层去除域变量,并将不同域数据投影到同一子空间中。此外,我们将所提出的方法与其他基于i-Vector的先进无监督域自适应技术进行了比较(例如基于自动编码器的域自适应,数据集间可变性补偿,数据集不变协方差标准化等)。对2013年域适应挑战(DAC)数据集的实验表明,所提出的方法不仅有效解决了数据集不匹配问题,而且还优于上述无监督域自适应方法。

   

   

猜你喜欢

转载自www.cnblogs.com/JarvanWang/p/9152673.html