AAC 格式简介

概述

AAC（Advanced Audio Coding），被认为是MP3的继任者，相对MP3有更高的压缩效率。

格式

ADTF（Audio Data Interchage Format)，音频数据交换格式：只有一个统一的头，必须得到所有数据后解码，适用于本地文件。扩展名 .m4a

ADTS (Audio Data Transport Stream)，音视数据传输流：每一帧都有头信息，任意帧解码，适用于传输流。

下面介绍ADTS格式的文信息

ADTS_Header的可以分为以下三部分：

adts_fixed_header：每一帧的内容是不变的。
adts_variable_header：每一帧的内容是存在变化的。
crc：16bits，protection_absent字段为0时存在。

adts_fixed_header：

字段	比特数	说明
syncword	12	所有位必须为1，即0xFFF。
ID	1	0代表MPEG-4, 1代表MPEG-2。
layer	2	所有位必须为0。
protection_absent	1	1代表没有CRC，0代表有。
profile	2	配置级别
sampling_frequency_index	4	标识使用的采样频率，具体见下表Table35。
private_bit	1	see ISO/IEC 11172-3, subclause 2.4.2.3 (Table 8).
channel_configuration	3	取值为0时，通过inband 的PCE设置channel configuration。
original/copy	1	编码时设置为0，解码时忽略。
home	1	编码时设置为0，解码时忽略。

在MPEG-2 AAC中定义了3种profile：

MPEG-2 AAC Main
MPEG-2 AAC LC (Low Complexity)
MPEG-2 AAC SSR (Scalable Sampling Rate)

在MPEG-4 AAC中定义了6种profile：

MPEG-4 AAC Main
MPEG-4 AAC LC (Low Complexity)
MPEG-4 AAC SSR (Scalable Sample Rate)
MPEG-4 AAC LTP (Long Term Predicition)
MPEG-4 AAC LD (Low Delay)
MPEG-4 AAC HE (High Efficiency) AACPlusV1/V2(3GPP)

adts_variable_header：

字段	比特数	说明
copyright_identification_bit	1	编码时设置为0，解码时忽略。
copyright_identification_start	1	编码时设置为0，解码时忽略
frame_length	13	帧长度，包括header和crc的长度，单位byte
adts_buffer_fullness	11
number_of_raw_data_blocks_in_frame	2	number of AAC Frames(RDBs) in ADTS frame minus 1, 为了最大的兼容性通常每个ADTS frame 包含一个AAC frame。

AAC ES部分说明

一个frame的原始数据包含1024个样本时间段的音频数据。

编码器简介

SBR（频带重现 Spectral Band Replication）是一种全新的音频编码增强工具，并已经在ISO/IEC 14496-3:2001/Amd.1:2003中被标准化。它提供了改善低比特率音频和音频编码音质的可能性，这是通过增加在特定比特率的音频带宽或改善在特定质量水平的编码效率而实现的。

SBR可以扩大传统感知编码在低比特率下所能提供的有限的音频带宽，因此它的性能表现相当于或超过模拟FM音的频带宽（15kHz)。SBR也可以改善窄带音频编码的质量，可为广播电台提供12kHz音频带宽的纯音频频道，可用如诸如多语言广播等场合。

由于大多数音频编码都是被严格地限制带宽的，因此SBR的重要性不仅体现在提高音频质量上，而且也体现在提高音频的可读性和理解性上。SBR是以后处理为主的，不过为能指导解码过程，在编码时编码器要先做一些预处理工作。
　　

从技术角度而言，SBR是在音频压缩算法中的一种实现高效高频率的编码新方法。当联合SBR一起使用，其主体编码器（比如mp3）只负责处理音频频谱的低频部分。

高频部分则由SBR解码器产生，这是紧跟在传统波形解码器之后的一个后处理过程。SBR基于对主体编码器处理得到的低频信号进行的分析，在解码器上重建了高频部分。为了确保精确的重建，一些指导信息以非常低的数据率夹杂在主体编码器产生的码流中一同传输。

重建对于和声和噪声成分同样有效，同时允许在频率范围和时间范围进行适当的修整。结果是，SBR实现了在非常低数据率下的全带宽音频编码，与主体编码器相比，明显地增加了压缩效率。
　　
SBR性能：
SBR可以改善感知音频编码的效率，在中等至低比特率下能提高大约30%（在某些特定情况下可能更高）。SBR具体能够提供的改善程度同时也依赖于其主体编码器。

举例说，联合mp3一起使用SBR（参考mp3PRO相关文章），我们可以在64kbps下达到相对传统的大于100kbps的立体声mp3的音频质量。SBR可应用于单声道，立体声甚至多声道的音频。

因此，可以说，SBR在主体编码器本身可编码的音频信号比特率范围和在有限的音频带宽下的可接受的编码噪音 (coding artifacts)水平内提供了最大的效率。
　　
PS(Parametric Stereo)：参量立体声技术是为提高低比特率立体声信号的音频压缩效率的下一个主要举措。参量立体声在MPEG-4中被完整地定义，并且是aacPlus v2中的新的组成部分。目前，参量立体声技术已面向16-40 kbps的范围进行优化，并能在象24 kbps这样低的比特率下提供高音频质量。

参量立体声编码器从音频信号的立体声影像中分解出其参量表示，而在传统模式下原始信号只会被编码为单声道表示。立体声映像信息被表现为少量的高质量的参量立体声信息，与单声道信号在比特流中同时传输。然后，基于接收到的参量立体声信息，解码器便可重建立体声映像，如下图。（注：这种作法类似于SBR Spectral Band Replication 频带复制的做法，也带有mp3中的Joint Stereo联合立体声的味道）。
　　
结果是，合并有参量立体声的低比特率，例如 24 kbps的音频比特流，所能让听众感受到的音频质量是显著地高于不具备参量立体声的相似音频比特流的质量。

参考：AAC编码器介绍_VectorAL的博客-CSDN博客

音频编码格式介绍-AAC - 简书

概述

格式

编码器简介

猜你喜欢