在视频会议或者在线课程中如何消除由于音箱输出的声音传递到麦克风而产生的回音，以降低听声辩音的压力，从而提高听课或者开会的专注度。

关于回声问题的描述，以及产生的影响

最近由于疫情影响，不方便前往学校教室听课，所以只能在线同步听课了，在一堂全英语授课的管理学的课程中，出现了传到我这里的声音很模糊不清，由于本来英语的水平就不高，听课也就勉强能懂，现在，再加上回声的干扰，非常影响理解，同时也很大程度的降低了专注力。课堂中也有同学提出来了这个问题，希望老师能在前端，也就是教室中通过物理方式解决，老师找了工程师检查后，问题依然存在。

关于如何在前端解决这个问题，youandyouyou在视频会议中回声消除与噪音抑制的技巧提出了一些很好的解决方案，可供参考，但是我的问题，却只能在接收端，也就是我能听到的这部分声音中进行解决了。菊风 Juphoon 在聊聊实时音视频中的技术难点：回声消除+噪声消除中提到，将声音从接收端分离，就像是把红蓝墨水混合到一起，然后再进行分离那样具有难度。但是，我相信有问题，就一定会有解决方案，虽然完整的分离出两种颜色非常困难，但那也不是我的目的，我只想听清楚声音就可以了呀。有没有一种方案是可以消解或者去除红墨水，只保留蓝墨水呢？

在这个思路的指引下，马上查找相关资料，看能不能把正常人的声音频率保留，而把其它频率的声音屏蔽掉呢，在维基百科中，对于语音频率的定义是这样的：

语音频率（英语：voice frequency，缩写VF）或语音频带（voice band）是指音频范围内传输语音的部分。
在电话（英语：Telephony）技术中，可用的语音频带范围约为300Hz至3400Hz。因此，300至3000Hz之间的电磁波谱特低频频带也被称为语音频率，其表示基带处的声能的电磁能量。为单个语音频率传输信道分配的带宽通常为4kHz，这包括保护频带（英语：Guard
band），以允许8kHz的采样率作为数字公共交换电话网（PSTN）所用的脉冲编码调变系统的基础。根据奈奎斯特-香农采样定理，采样频率（8kHz）必须至少是在离散时间（4kHz）采样之前进行适当滤波的语音频率最高部分的两倍，从而有效重建语音信号。

基本频率如下：

典型成年男性的人声基本频率为85至180Hz，典型成年女性则为165至255Hz。[1][2]因此，大多数语音的基调频率位于上述“语音频率”频带的底部以下。但是，足够的泛音列将作为消失的基频出现，从而达到听到基本音调的感觉。

刚好最近为了解决多个音响能否组合成为立体声的问题，下载了一款软件，VOICE MEETER，可以对不同的声道进行分离，也可以用EQ调整音效，那么就先从调整音效开始吧。关于如何下载和使用这款软件，可以参考我之前写的文章【如何将任意品牌型号的蓝牙音响组合成环绕立体声】，接下来主要讲一下，我通过EQ的调整对降低这种回音的尝试：

通过调整VOICE MEETER 的EQ设置降低回声

首先，需要通过VOICE MEETER 设置声音输入来源和对应的输出设备，如下图如示：
在这里插入图片描述
当选定了输入源，并指定了输出设备之后，就要对相应输出信号的EQ进行调整。调整的方向很明确，就是把人声所对应部分的频率放大，其它频段的数值降低，或者也可以保持不变，第一次尝试的调整值如下：
在这里插入图片描述

结果出人意料，效果更加糟糕了，虽然效果变差，回音更大，可是我却开始高兴起来了，因为有戏，虽然，正面加强得到的是反作用，但这肯定是一个正确的错误，我只要往相反的方向再试一下，就一定可以了，所以，接下来就将这一频段的数值降低，其它的保持不变，如下图：
在这里插入图片描述
果然，这次的效果出其的好，非常完美的解决了，声音重叠和回音干扰的问题，听起来清澈而透明，亦犹如乌云飘开后，呈现在夜空中的那一轮明月一样…

回过头来想想原因，也许是因为降低了人声频段中的音量之后，剩下的就是从音箱反馈到麦克风的这部分的声音，也许，还有其它的原因。总之，通过这种方法，可以很好的解决接收端回声严重干扰的问题，很完美的解决了接收端消除回声的问题，希望对你也能有所帮助。

在这里，要感谢 youandyouyou 和菊风 Juphoon 分享的文章，让我对于这个问题有了更进一步的理解。另外由于本人对于音频相关的知识不足，本文也仅是通过对尝试解决回音这个问题，而展开的一些摸索，以及解决问题的一些思路，仅供参考，如有不足之处，请指正，谢谢！