基于音频分类的视频内容推荐

哈喽大家好,上面几篇做法是提取的对数mel谱然后用VGG做embedding特征,是否靠谱不得而知,但效果很差是明显的,寡人猜测原因:1.VGG训练的数据很短,很干净,没有其他杂音;2.其他细节问题,比如参数的微调;3.其他特征??

很多人骂我不分享代码,其实都是基础的东西,没有啥技术含量,这里分享下python一个版本stft【np中当然有直接的函数,这个版本也有依赖】。今天下午我有搜索下“音频分类在视频内容方面的应用”,也下载了很多毕业论文,过年看,没时间玩了。

不知道豪言壮志能不能实现【吹出去的牛逼实现了吗??回家就不带电脑,只看论文可以不?拭目以待,等我来还债】

Flag立下了,实现不了就让我还单着,年后见!!!

待续。。。

发布了208 篇原创文章 · 获赞 190 · 访问量 4万+

猜你喜欢

转载自blog.csdn.net/SPESEG/article/details/104075939