语音情感数据库分为离散型和维度型。再有根据情感产生分类分为自然型,表演型,引导型。
离散型指的是把情感分为高兴、愤怒、恐惧、惊奇、悲伤、厌恶等。
连续型就是先采集,然后让其它人根据三维情感评分,情感维度包括:唤醒度、愉悦度、支配度。可以参考有关SAM的文章。(MEASURING EMOTION: THE SELF-ASSESSMENT MANIKIN AND THE SEMANTIC DIFFERENTIAL)里面有详细介绍和评分规则。
1.离散型情感数据库
(1)maribor数据库。这个是多语种的,8大类情感;
(2)BelFast数据库。有40个被试,6类基本情感;
(3)FAU AIBO。这个可以登录他们官网,是一个做模式识别的实验室,然后发邮件申请,是个自然型的(自然型数据库很少很少);
(4)EMO-DB 。 这个是德语的,是个表演型的,就是让10个演员来表演各种感情的;
(5)BES。这个也是德语;
(6)CASIA。这个是汉语的,不过貌似要钱;
(7)Accorpus。这个也是汉语的,有多个子系列。
Accorpus_MM 多莫泰多通道(50被试)
Accorpus_SR 情感语音识别的
Accorpus_SA 情感分析
2.维度型情感数据库
VAM 据说是开放式的