esp32~MP3音频文件学习

主要了解了MP3文件结构及每个部分含义，音频处理的专业术语概念。
比较重要的概念：

1. 编码

从信息论的观点来看，描述信源的数据是信息和数据冗余之和，即：数据=信息+数据冗余。音频信号在时域和频域上具有相关性，也即存在数据冗余。将音频作为一个信源，音频编码的实质是减少音频中的冗余。
自然界中的声音非常复杂，波形极其复杂，通常我们采用的是脉冲代码调制编码，即PCM编码。PCM通过抽样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。

2. 比特率

是指每秒传送的比特(bit)数。单位为bps(Bit Per Second)，比特率越高，传送的数据越大。在音频、视频领域，比特率常翻译为码率，比特率表示经过编码（压缩）后的音、视频数据每秒钟需要用多少个比特来表示，而比特就是二进制里面最小的单位，要么是0，要么是1。比特率与音、视频压缩的关系，简单的说就是比特率越高，音频、视频的质量就越好，但编码后的文件就越大；如果比特率越少则情况刚好相反。

比特率 = 采样率 * 采样位数 * 声道数

3. 码率/码流/位率：

是指音频、视频文件在单位时间内使用的数据流量，通俗一点的理解就是取样率,是音频、视频编码中质量控制中最重要的部分，一般我们用的单位是Kb/s、Mb/s。一般来说码流越大，压缩比就越小，质量就越高。码流越大，说明单位时间内取样率越大，数据流，精度就越高，处理出来的文件就越接近原始文件。

4. MP3简述

MP3全称为MPEG Audio Layer 3，它是一种高效的计算机音频编码方案，它以较大的压缩比将音频文件转换成较小的扩展名为.mp3的文件，基本保持源文件的音质，MP3是ISO/MPEG标准的一部分，

ISO/MPEG标准描述了使用高性能感知编码方案的音频压缩，此标准一直在不断更新以满足“质高量小”的追求，现已形成MPEG Layer1、Layer2、Layer3三种音频编解码方案，分别对应MP1、MP2、MP3 这三种声音文件

MPEG(Moving Picture Expert Group)是ISO下的一个动态图像专家组，它指定的MPEG标准广泛的应用于各种多媒体中，MPEG标准包括视频和音频标准，其中音频标准已制定出MPEG-1、MPEG-2、MPEG-2 ACC、MPEG-4。MPEG-1和MPEG-2标准使用同一个音频编解码族Layer1、2、3，MP3绝大多数使用的是MPEG1标准

MP3音频压缩包含编码和解码两部分，编码是将原始信号转换成电平信号的过程，解码即是逆过程，MP3 采用了感知音频编码（PerceptualAudio Coding）这一失真算法。人耳感受声音的频率范围是20Hz-20kHz，MP3截掉了大量的冗余信号和无关的信号，编码器通过混合滤波器组将原始声音变换到频率域，利用心理声学模型，估算刚好能被察觉到的噪声水平，再经过量化，转换成Huffman编码，形成MP3位流。解码器要简单得多，它的任务是从编码后的谱线成分中，经过反量化和逆变换，提取出声音信号。

5. MP3文件结构

大体上分为三个部分：ID3V2+音频数据+ID3V1
MP3文件结构
更多详细参考

MP3格式音频文件结构解析、MP3文件格式解析

MP3文件结构解析(超详细)、MP3格式音频文件结构解析

MP3文件格式解析、MP3编码分析 - xiahouzuoxin

Hynson 博客专家

发布了99 篇原创文章 · 获赞 185 · 访问量 20万+

私信关注