【Android RTMP】音频数据采集编码 ( AAC 音频格式解析 | FLV 音频数据标签解析 | AAC 音频数据标签头 | 音频解码配置信息 )





安卓直播推流专栏博客总结



Android RTMP 直播推流技术专栏 :


0 . 资源和源码地址 :


1. 搭建 RTMP 服务器 : 下面的博客中讲解了如何在 VMWare 虚拟机中搭建 RTMP 直播推流服务器 ;

2. 准备视频编码的 x264 编码器开源库 , 和 RTMP 数据包封装开源库 :

3. 讲解 RTMP 数据包封装格式 :

4. 图像数据采集 : 从 Camera 摄像头中采集 NV21 格式的图像数据 , 并预览该数据 ;

5. NV21 格式的图像数据编码成 H.264 格式的视频数据 :

6. 将 H.264 格式的视频数据封装到 RTMP 数据包中 :

7. 阶段总结 : 阿里云服务器中搭建 RTMP 服务器 , 并使用电脑软件推流和观看直播内容 ;

8. 处理 Camera 图像传感器导致的 NV21 格式图像旋转问题 :

9. 下面这篇博客比较重要 , 里面有一个快速搭建 RTMP 服务器的脚本 , 强烈建议使用 ;

10. 编码 AAC 音频数据的开源库 FAAC 交叉编译与 Android Studio 环境搭建 :

11. 解析 AAC 音频格式 :

12 . 将麦克风采集的 PCM 音频采样编码成 AAC 格式音频 , 并封装到 RTMP 包中 , 推流到客户端 :






Android 直播推流流程 : 手机采集视频 / 音频数据 , 视频数据使用 H.264 编码 , 音频数据使用 AAC 编码 , 最后将音视频数据都打包到 RTMP 数据包中 , 使用 RTMP 协议上传到 RTMP 服务器中 ;


视频推流 : 之前的一系列博客中完成手机端采集视频数据操作 , 并将视频数据传递给 JNI , 在 NDK 中使用 x264 将图像转为 H.264 格式的视频 , 最后将 H.264 格式的视频打包到 RTMP 数据包中 , 上传到 RTMP 服务器中 ;


音频推流 : 开始进行音频直播推流操作 , 先采集音频 , 将音频编码为 AAC 格式 , 将编码后的音频打包成 RTMP 包 , 然后推流到服务器中 ;





一、 AAC 音频格式解析



1 . AAC 音频文件格式 :


① ADIF 格式 : 音频数据交换格式 ( Audio Data Interchange Format ) , 只有一份音频解码信息 , 存储在文件开头 , 这种格式适合存储音频文件 , 节省空间 , 但是必须从开始播放才可以 , 从中间位置无法播放 ;

② ADTS 格式 : 音频数据传输流格式 ( Audio Data Transport Stream ) , 每隔一段音频数据 , 就会有一份音频解码信息 , 这种格式适合音频流传输 , 可以在任何位置开始解码播放 ;


2 . 推流数据分析 : 当前的需求是需要将 FAAC 编码后的 AAC 数据推流到 RTMP 服务器中 , 推流时 , 需要推流的 AAC 格式不是上述两种格式 , 而是纯 AAC 裸数据 ;


3 . 音频帧数据必须完整 : 音频帧与视频帧存储机制不同 , 视频帧分为关键帧和非关键帧 , 音频采样都是关键帧 , 少一个采样都会有问题产生 , 如电流 , 卡顿等问题 ;





二、 FLV 音频数据标签解析





1. 分析 FLV 格式中的 AAC 音频格式数据


分析 FLV 格式中的 AAC 音频格式数据 : 下图中的第 2 2 个音频数据标签 , 存储了音频特殊配置 , 之后的 AAC 音频数据标签都是普通的音频采样数据 ;


① 视频解码数据配置 : 视频的第一个视频标签数据是 H.264 , AVC 序列头数据 ( H.264 : AVC Sequence Header ) , 指导后续视频帧如何解码 ;

② 音频解码数据配置 : 音频的第一个音频标签数据是 AAC , 音频特殊配置数据 ( AAC : Audio Specific config ) , 指导后续音频采样如何解码 ;

在这里插入图片描述



2. AAC 音频特殊配置


打开第 2 2 个音频数据标签 : 内容如下 , 这是完整的音频标签数据 ;

0x000001bf	:   08 00 00 07 00 00 00 00 
0x000001c7	:   00 00 00 AF 00 12 10 56 
0x000001cf	:   E5 00 00 00 00 12

在这里插入图片描述



3. AAC 音频数据标签


AAC 音频数据标签 : 该标签中封装实际的音频采样 , AAC 格式的 ;

0x00017494	:   08 00 00 13 00 00 85 00 
0x0001749c	:   00 00 00 AF 01 21 1A 93 
0x000174a4	:   40 7D 6B 94 64 A0 9A 03 
0x000174ac	:   EB 5C A3 25 05 C0 00 00 
0x000174b4	:   00 1E

在这里插入图片描述





三、 FLV 音频数据标签头



音频标签数据标签头解析 : 前 11 个字节时标签头信息 ; 11 11 个字节仅做参考 , 在 RTMP 中是不封装这个标签头的 ;

0x000001bf	:   08 00 00 07 00 00 00 00 
0x000001c7	:   00 00 00

① 标签类型 ( tag type ) : 1 1 字节 , 索引区间 [ 0 ] [0] , 08 代表音频 , 09 代表视频 , 12 代表脚本信息 , 这里是 08 , 代表音频数据 ;

② 标签数据大小 ( data size ) : 3 3 字节 , 索引区间 [ 1 , 3 ] [1,3] , 除了包头之外的数据大小 , 包头一般是 11 11 字节, 整个标签大小是该 标签数据大小 ( data size ) + 11 , 本标签的数据大小是 7 7 字节, 总的数据大小是 18 18 字节, 十六进制对应 0x 12 12

③ 时间戳 ( time stamp ) : 3 3 字节 , 索引区间 [ 4 , 6 ] [4,6] , 表示从开始播放到当前时刻的播放时间 , 单位毫秒 , 也就是当前标签的时间与第一个标签时间的差值 ; 一般是 00 00 00 ;

④ 时间戳扩展位 ( time stamp ext ) : 1 1 字节 , 索引区间 [ 7 ] [7] , 如果时间戳较大 , 3 3 位装不下 , 扩展一位 ; 一般是 00 ;

⑤ 流编号 ( stream id ) : 3 3 字节 , 索引区间 [ 8 , 10 ] [8,10] , 一般都是 00 00 00 ;


组装 RTMP 包的时候 , 是不需要封装标签头的 , 直接将 AAC 裸数据 , 也就是这 7 7 个字节封装到 RTMP 包中 ;





四、 音频解码配置信息





1. AAC 音频数据


AAC 音频数据 : 分为两类 , 解码配置数据, 音频采样数据 ;


① AAC 格式音频解码配置信息 : 下面的 7 7 个字节时音频解码配置信息 ;


0x000001bf	:   
0x000001c7	:            AF 00 12 10 56 
0x000001cf	:   E5

② AAC 音频数据标签数据采样信息 :

0x0001749c	:            AF 01 21 1A 93 
0x000174a4	:   40 7D 6B 94 64 A0 9A 03 
0x000174ac	:   EB 5C A3 25 05 C0


2. 第 1 1 字节 AF 数据解析


1 1 字节 AF 数据解析 : 4 4 位表示音频格式 , 之后的 2 2 位表示采样率 , 之后的 1 1 位表示采样长度 , 最后一位表示音频类型 ;


① 0xAF 使用二进制表示为 0b‭1010 1111‬ ;

② 音频格式 : 4 4 位 [ 7 : 4 ] : 0b1010 = 10 , 值为 10 , 表示 AAC 格式 ;

③ 采样率 : 2 2 位 [ 3 : 2 ] : 0b11 = 3 , 代表 44000 Hz 采样率 , AAC 格式一般都是 44000 采样率

采样率
0 5500Hz
1 11000Hz
2 22000Hz
3 44000Hz

④ 采样位数 : 1 1 位 [ 1 ] : 0b1 = 1 , 代表采样长度 16 位 ;

采样位数
0 8 位 / 1 字节
1 16 位 / 2字节

⑤ 音频通道 : 1 1 位 [ 0 ] : 0b1 = 1 , 代表立体声 ;

音频通道
0 单声道
1 立体声

该位一般也就是声道不同 , 其它参数基本都是默认的值 , 立体声 AF , 单声道 AE ;



3. 音频数据类型


音频数据类型 :


① 音频解码配置信息 : 前两位是 AF 00 , 指导 AAC 数据如何解码 ;

② 音频采样信息 : 前两位是 AF 01 , 实际的 AAC 音频采样数据 ;

猜你喜欢

转载自blog.csdn.net/han1202012/article/details/106802700