音频编解码算法库 (可支持g711u,g711a,g729,g722,opus等)

一、数字音频基础概念

PCM:脉冲编码调制,是一种模拟信号的数字化方法。它是最常用、最简单的波形编码方式,我们通常说的音频数字信号的原始编码一般就指的这种编码方式,当然也有其他的方式,这里不做讨论。

1、PCM的实现过程:

 

 2、采样率

        采样率(采样频率)即每秒内进行采样的次数。符号是fs,单位是Hz。采样率越高,数字波形的形状就越接近原始模拟波形,声音的还原就越真实。

        如下是同一波形的两种采样率对比,可以看到低采样率的A采样波形严重失真,而高采样率的B则几乎完全重现原始波形:

        根据奈奎斯特-香农采样定理,只有采样频率高于原始模拟信号中最高频率的两倍时,才能把数字信号表示的模拟信号准确还原回去。例如,CD 的采样率为每秒 44,100 个采样,因此可重现最高为 22,050 Hz 的频率,此频率刚好超过人类的听力极限 20,000 Hz。实际应用中采样频率一般为信号最高频率的2.56~4倍。

数字音频领域常用的采样率如下表:

二、常见的几种音频编码类型带宽对比:

        根据采样定理,8kHz的采样速率这种的就是常说的窄带编码,宽带编码的采样速率是16kHz以上,G.722、OPUS就是这种编码。

编解码类型

压缩速率(Kbps)

G.729

8 Kbps

G.711

64 Kbps

OPUS

6-510 Kbps

G722

64 Kbps

1、G.711
采样率:8kHz 
信息量:64kbps
理论延迟:0.125msec 
品质:MOS值4.10

2、G.729
采样率:8kHz 
信息量:8kbps 
理论延迟:15msec 
品质:MOS值3.9

3、G.722
采样率:16kHz 
信息量:64kbps 
理论延迟:0.125msec
品质:MOS值4.5

4、OPUS
采样率:8kHz--48kHz 
信息量:6kbps--510kbps 
理论延迟:5 ms - 65.2 ms
品质:MOS值4.5

三、自研的音频编解码算法库

        为了解决各种音频编解码的差异性,我根据多年的音视频编解码经验自研整理了一个编解码算法库,可以支持多种平台应用,项目支持g711u,g711a,g729,g722,opus等音频编解码算法及测试程序和音频文件,后续还会继续更新迭代算法,接口调用也特别简单,几行代码就可以解决所有的音频编解码工作,让音视频开发更简单;

项目地址

https://download.csdn.net/download/unique_no1/85069469

里面包含测试程序和可执行文件,windows平台和linux平台的我都已经编译好了,大家可以测试看下效果,其他平台如有需要也可以支持,如果需要沟通交流可以跟我联系。

微信:unique_no_1

猜你喜欢

转载自blog.csdn.net/unique_no1/article/details/123925991