技术实操丨SoundNet迁移学习之由声音分类到语音情感识别 - 代码天地

技术实操丨SoundNet迁移学习之由声音分类到语音情感识别

其他 2020-10-14 18:01:49 阅读次数: 0

摘要：声音也是识别对象的一种重要数据源。其中根据声音来识别声音所处的环境也是语音识别的研究内容之一。

一、思路

1、SoundNet模型在视频数据中先预训练，视频任务可能是场景识别，可参考这篇文章SoundNet: Learning Sound Representations from Unlabeled Video。

2、迁移学习：5层的soundnet只取前3层作为迁移层，在新数据集中训练时保持着三层不变，其余两层随机初始化，再训练。

3、在新数据如IEMOCAP中fine-tuning

二、实验数据

三、实验结果

评价指标：AUC

Scratch表示随机初始化的SoundNet。

四、总结

1、面对音频数据稀缺，给出了很好的解决思路，可根据SoundNet文章中的思路，先从视频数据入手，学习SoundNet参数，然后应用到自己的场景中；

2、跨语言迁移学习：文章中从英语场景迁移到汉语场景，效果比单一数据训练提升很大；

3、YFCC100m 、Google AudioSet可用于预训练模型。

参考文献：

[1] ElShaer M E A, Wisdom S, Mishra T. Transfer Learning From Sound Representations For Anger Detection in Speech[J]. arXiv preprint arXiv:1902.02120, 2019.

点击关注，第一时间了解华为云新鲜技术~

猜你喜欢

转载自blog.csdn.net/devcloud/article/details/108975073

技术实操丨SoundNet迁移学习之由声音分类到语音情感识别

【飞桨PaddleSpeech语音技术课程】— 声音分类

语音情感识别--语音(声音的预处理)

语音情感识别技术

【深度学习-语音分类】语种识别挑战赛Baseline

【深度学习-语音分类】婴儿啼哭声识别挑战赛Baseline

基于DBN神经网络的语音分类识别

SoundNet：根据声音来识别场景环境实践

基于PaddlePaddle实现声音分类

基于Tensorflow实现声音分类

华为云ModelArts-声音分类

基于Pytorch实现的声音分类

【情感识别】基于matlab K近邻分类算法的语音情感识别【含Matlab源码 542期】

深度学习整理篇（二）语音分段和讲话人语音文件识别

情感语音识别---识别网络

简单的语音分类任务入门

语音识别（五）：声音识别

机器学习PAI通过声音分辨男女(含语音特征提取相关数据和代码)

spring再学习之AOP实操

语音情感识别--踩点篇

语音情感识别--理论篇

Tutorial--语音情感识别

多分类：MNIST实操

论文笔记：语音情感识别（五）语音特征集之eGeMAPS，ComParE，09IS，BoAW

R语言深度学习的魔法声音：语音合成技术的奥秘

语音识别技术学习：CMU Sphinx

【实作】RNN-文本情感分类

Hbase入门到实操

Oracle实例迁移_真实场景实操

情感语音识别---特征提取

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)