PCM数据格式

转载：https://my.oschina.net/u/589963/blog/167526

1. 8 Bit 单声道：

采样1	采样2
数据1	数据2

2. 8 Bit 双声道

采样1		采样2
声道1数据1	声道2数据1	声道1数据2	声道2数据2

1. 16 Bit 单声道：

采样1		采样2
数据1低字节	数据1高字节	数据1低字节	数据1高字节

2. 16 Bit 双声道

采样1
声道1数据1低字节	声道1数据1高字节	声道2数据1低字节	声道2数据1高字节
采样2
声道1数据2低字节	声道1数据2高字节	声道2数据2低字节	声道2数据2高字节

对于ffmpeg来说，音频数据会保存在AVFrame中extended_data数组中，如果是打包模式(packed)，就只用extended_data[0],如果是planar模式，则每个channel分别保存在extended_data[i]中。对于音频，只有linesize[0]有效，打包模式保存整个音频帧的buff大小，planar模式保存每个channel的buff大小。

ffmpeg中对两种模式(planar和packed)的说明(在frame.h文件中有详细说明)：

* For planar audio, each channel has a separate data pointer, and
* linesize[0] contains the size of each channel buffer. //所有的通道长度是一样的
* For packed audio, there is just one data pointer, and linesize[0]
* contains the total size of the buffer for all channels.

下面是一个小例子来存储格式数据(利用ffmpeg):

short *sample_buffer_L = pFrame->extended_data[0];//存放着左声道的数据
short *sample_buffer_R = pFrame->extended_data[1];//存放着右声道的数据

两者都是16bit，而裸的PCM文件里的数据是按照 LRLRLRLR 这样存储的，所以我们需要按照这种格式存储16bit的数据：

//Left channel
data[i] = (char)(sample_buffer_L[j] & 0xff);//左声道低8位
data[i+1] = (char)((sample_buffer_L[j]>>8) & 0xff);;//左声道高8位
//Right channel
data[i+2] = (char)(sample_buffer_R[j] & 0xff);//右声道低8位
data[i+3] = (char)((sample_buffer_R[j]>>8) & 0xff);;//右声道高8位

猜你喜欢