webRTC的VAD算法的研究 - 代码天地

webRTC的VAD算法的研究

其他 2019-08-08 00:51:21 阅读次数: 0

摘要：

在上一篇的文档中，分析unimrcp中vad算法的诸多弊端，但是有没有一种更好的算法来取代呢。目前有两种方式 1. GMM 2. DNN。

其中鼎鼎大名的WebRTC VAD就是采用了GMM 算法来完成voice active dector。今天笔者重点介绍WebRTC VAD算法。在后面的文章中，

我们在刨析DNN在VAD的中应用。下面的章节中，将介绍WebRTC的检测原理。

原理：

首先呢，我们要了解一下人声和乐器的频谱范围，下图是音频的频谱。

本图来源于网络

根据音频的频谱划分了6个子带，80Hz~250Hz，250Hz~500Hz,500Hz~1K,1K~2K,2K~3K,3K~4K，分别计算出每个子带的特征。

步骤：

第一步：降频

WebRTC 支持8kHz 16kHz 32kHz 48kHz的音频，但是WebRTC首先都将16kHz 32kHz 48kHz首先降频到8kHz，再进行处理。

 1         int16_t speech_nb[240];  // 30 ms in 8 kHz.
 2         const size_t kFrameLen10ms = (size_t) (fs / 100);
 3         const size_t kFrameLen10ms8khz = 80;
 4         size_t num_10ms_frames = frame_length / kFrameLen10ms;
 5         int i = 0;
 6         for (i = 0; i < num_10ms_frames; i++) {
 7             resampleData(audio_frame, fs, kFrameLen10ms, &speech_nb[i * kFrameLen10ms8khz],
 8                          8000);
 9         }
10         size_t new_frame_length = frame_length * 8000 / fs;
11         // Do VAD on an 8 kHz signal
12         vad = WebRtcVad_CalcVad8khz(self, speech_nb, new_frame_length);

猜你喜欢

转载自www.cnblogs.com/damizhou/p/11318668.html

webRTC的VAD算法的研究

WebRTC VAD算法初探

移植WebRTC中的VAD

WebRTC VAD流程解析

webrtc Histogram（直方图）算法研究

Android Studio 单独编译WebRTC的 vad 模块

Webrtc研究

WebRTC VAD 中所用滤波器之分析

说话人识别VAD算法概述

WebRTC研究：sending_

WebRTC研究：audio 重传

Android 单独抽取 WebRtc-VAD（语音端点检测）模块

pc 与 android webrtc 通信的研究

WebRTC中的NETEQ技术的研究

WebRTC研究：丢包与抖动

WebRTC点对点应用架构研究

VAD语音分割算法原理与简单实现

WebRtc中的AEC算法

Webrtc NS模块算法

WebRTC中的混音算法

WebRTC 音频算法

WebRTC之STUN、TURN和ICE研究

基于webrtc多人音视频的研究

WebRTC研究：视频丢包判断

WebRTC研究：rrt 时间之 CallStats

WebRTC研究：audio 丢包判断

WebRTC技术研究一入门

VAD综述

研究算法

基于webrtc多人音视频的研究（一）基于webrtc多人音视频的研究（一）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)