【数据压缩3】AVI文件格式分析及问题回答+WAV文件格式分析

AVI文件问题回答

1.AVI文件音频和视频的数据是如何放置的,交织放置还是连续放置?

(1)定义:AVI英文全称为Audio Video Interleaved,即音频视频交错格式,是微软公司于1992年11月推出、作为其Windows视频软件一部分的一种多媒体容器格式。 AVI文件将音频(语音)和视频(影像)数据包含在一个文件容器中,允许音视频同步回放。 类似DVD视频格式,AVI文件支持多个音视频流。
由定义可知为交织放置

(2)AVI文件格式:

音频数据块(30 31 77 62),即“01wb”在这里插入图片描述
视频数据块(30 30 64 63),即“00dc”
在这里插入图片描述
由文件格式分析可知为交织放置

2.AVI文件一个视频帧大约占据多少字节?一个音频数据块大约占用多少字节?

大多数音频数据块的大小都是00 00 01 A2,即418个字节
视频数据块的大小各不相同

WAV文件格式分析

文件概述

WAV(Waveform Audio File Format),它采用RIFF(Resource Interchange File Format)文件格式结构。通常用来保存PCM格式的原始音频数据,所以通常被称为无损音频。但是严格意义上来讲,WAV也可以存储其它压缩格式的音频数据。

文件格式

WAV文件属于RIFF结构形式,遵循RIFF规则,其内容以区块(chunk)为最小单位进行存储。一个WAV文件通常有三个chunk以及一个可选chunk组成,其在文件中的排列方式依次是:RIFF chunk(RIFF数据块),Format chunk(描述文件信息),Fact chunk(附加块,可选),Data chunk(表示真正的音频数据)。

RIFF区块

名称 偏移地址 字节数 端序 具体内容
ID信息 0x00 4 大端 “RIFF”(0x52494646)
Size(文件数据长度) 0x04 4 小端 fileSize - 8
Type(文件类型) 0x08 4 大端 “WAVE”(0x57415645)

在这里插入图片描述
52 49 46 46-----RIFF块标识,表示该文档是一个有效的RIFF文档
在这里插入图片描述
在这里插入图片描述

CE 2D 26 00-----表示文件的数据长度,其数值为“00 26 2D CE”,转换为十进制为2502094。由文件属性可以看到文件大小为2502102字节,证明文件的数据长度为文件长度-8,即2502094=2502102-8
在这里插入图片描述
57 41 56 45-----RIFF的块数据,其中前4个字节为文件格式类型标识,说明此文件是WAV文件,其它部分为RIFF块的子块。

FORMAT区块

名称 字节数 说明
格式块标识 4字节 小写字符串“fmt ”
格式块长度 4字节 格式块长度取决于编码形式(参见编码形式表)
编码格式代码 2字节 常见的 WAV 文件使用 PCM 脉冲编码调制格式,该数值通常为 1。(参见编码形式表)
声道个数 2字节 单声道为 1,立体声或双声道为 2
采样频率 4字节 每个声道单位时间采样次数。常用的采样频率有 11025, 22050 和 44100 Hz。
数据传输速率 4字节 声道数×采样频率×每样本的数据位数/8。播放软件利用此值可以估计缓冲区的大小。
数据块对其单位 2字节 采样帧大小。该数值为:声道数×位数/8。播放软件需要一次处理多个该值大小的字节数据,用该数值调整缓冲区。
采样位数 2字节 存储每个采样值所用的二进制数位数。常见的位数有 4、8、12、16、24、32

编码形式表

扫描二维码关注公众号,回复: 15242665 查看本文章
格式代码 格式名称
1(0x0001) PCM/非压缩格式
2(0x0002) Microsoft ADPCM
3(0x0003) IEEE float
6(0x0006) ITU G.711 a-law
7(0x0007) ITU G.711 μ-law
49(0x0031) GSM 6.10
64(0x0040) ITU G.721 ADPCM
65,534(0xFFFE)

在这里插入图片描述

66 6D 74 20--------ID标识(fmt)
12 00 00 00---------数据长度
03 00-----查编码格式表可知,为IEEE float编码
02 00-----双声道
80 BB 00 00--------音频采样率,小端存储,采样率为48000
00 DC 05 00--------每秒字节数,小端存储,“00 05 DC 00”化为十进制为384000bps
08 00-----------------采样帧大小,即每个采样所需的字节数,等于声道数×采样位数 / 8,即2×32/8=8B
20 00-----------------每个采样存储比特数,小端存储,32bit
00 00-----------------表示附加信息

Data区块

名称 字节数 说明
格式块标识 4字节 表示这是一个data块
格式块长度 4字节 表明数据块的长度
数据 N字节 表示音频数据

在这里插入图片描述
64 61 74 61-----ID标识(data)
00 F8 25 00-----数据长度,小端存储,“00 25 F8 00”化为十进制为2488320字节,文件播放时间为音频数据字节数/数据传输速率=2488320/384000=6.48s,约为6秒
在这里插入图片描述
由文件属性可知,音频时长实际确实为6秒

猜你喜欢

转载自blog.csdn.net/ppinecone/article/details/124583019
今日推荐