声音场景分类问题探讨 - 代码天地

声音场景分类问题探讨

其他 2020-01-21 12:00:33 阅读次数: 0

如果按照上一篇的想法来做的话，我估计效果不好。

策略：提取视频时长所有音频，特征提取后进入VGG网络，然后将VGG features avg，这样特征如果不明显的话就可能在avg后直接消失了，这种影响还是很大的。我估计最后可能会完全趋于白噪声，这不是扯淡吗？

话不多说，先提取音频文件再说，挨个听真的费劲啊，卧槽，就是怕有脏数据。

先拿抖音干净的数据来玩，主要是因为抖音的视频数据是我挨个下载的，并且声音都有特别之处，没有啥特别的就没分为1类，另有其他非1视频或者啥都有的视频作为other/用来测试看看能不能挑出来1类的视频。

上面其实涉及到一个问题：维度不同如何做相似度？？？这是动态规划的问题？？

【

细节问题记录：我输入VGG模型的时长是28秒，而且我还特地取整了，这特么得到的结果还是batch还是29，卧槽，这是为啥子

一脸懵逼。经查发现最后一个batch的数值基本上全是相同的，因此去掉。

】

做过avg后特征基本上全被湮灭了，没有特征了。卧槽，如图下，0的部分或多或少有1中的，但不是全部，然而结果很差。

所以做avg到底有没有依据？？？我觉得还是原始的做max比较好，这样特征可能会显现。

因为抖音最后3秒可能有自带的“抖音”声音，所以取倒数[-8:-3]的5秒数据，然后max，结果仍旧意料之中。很差

所以我感觉这个所谓的高层特征纯属扯淡。

场景分类根本不行，所以依旧用传统的场景分类办法试试吧

【为啥用抖音的数据？很显然，其声音很显然的特征，任何人都能感觉到。如果抖音的数据都做不成，其他差得数据更难做了】

下班，票还没买到啊。卧槽

另外有相关问题可以加入QQ群讨论，不设微信群

QQ群：868373192

语音图像视频深度-学习群

SpeechImageKing

发布了206 篇原创文章 · 获赞 188 · 访问量 4万+

私信关注

猜你喜欢

转载自blog.csdn.net/SPESEG/article/details/104006642

声音场景分类问题探讨

声音场景分类问题探讨（二）

AI智能配音助手微信小程序源码支持多种声音场景选择

关于电脑看电影时对话声音小场景声音大声音忽大忽小的问题

声音(音乐)分类综述

CVPR 2022 Oral | 人大高瓴AI学院提出：面向动态视音场景的问答学习机制

声音类型分类之初步

JXL GC 问题探讨

SQL JDBC 问题探讨

公司经营问题探讨

关于某个问题的探讨

PlayClipPoint声音太小的问题

WiFi MESH场景下配置同步探讨

krpano教程 - 场景中加入声音

列表、margin和padding的探讨、标签的分类

基于PaddlePaddle实现声音分类

基于Tensorflow实现声音分类

华为云ModelArts-声音分类

基于Pytorch实现的声音分类

场景分类方法总结

字符编码/字符集简明分类---分类方式探讨---转换方法探讨

给用户信息加密的问题探讨

探讨select in 在postgresql的效率问题

树的遍历问题探讨及总结

main函数相关问题探讨

关于SSD寿命问题的探讨

汉诺塔问题探讨

Java多线程问题探讨

kthread_stop问题探讨

探讨Java参数传递问题

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)