数据压缩原理与应用 图像文件的读写和转换(BMP2YUV)实验报告

一、实验原理

1.BMP文件的组成结构

      BMP(全称 Bitmap )是Windows操作系统中的标准图像文件格式 ,可以分成两类:设备相关位图(DDB )和设备无关位图( DIB),使用非常广。它采用位映射存储格式,除了图像深度可选以外,在绝大多数应用中不采用其他任何压缩,因此BMP文件所占用的空间很大。 BMP 文件的图像深度可选 1bit、4bit 、 8bit 、16bit及 24bit ,指存储每个像素所用的位数。BMP 文件存储数据时,图像的扫描方式是按从左到右、从下到上的顺序。由于 BMP 文件格式是 Windows环境中交换与图有关的数据的一种标准,因此在 Windows 环境中运行的图形软件都支持BMP图像格式。

      根据文件的自包含性,一个完整的文件中不仅包含实际数据信息,还会包含一部分用来解析实际数据的元数据。例如BMP图像文件由下列四部分组成,其中前三部分(文件头、信息头、调色板)就属于元数据,最后一部分才是真正存储位图信息的图像数据字节序列。

 

位图文件头BITMAPFILEHEADER
位图信息头BITMAPINFOHEADER
调色板Palette
实际的位图数据ImageData

 

(1)位图头文件数据结构,它包含BMP 图像文件的类型、显示内容等信息;

typedef struct tagBITMAPFILEHEADER {
        WORD         bfType;            /* 说明文件的类型  */
        DWORD      bfSize;              /* 说明文件的大小,用字节为单位  */
                                                      /*注意此处的字节序问题
        WORD         bfReserved1;   /* 保留,设置为0 */
        WORD         bfReserved2;   /* 保留,设置为0 */
        DWORD      bfOffBits;         /* 说明从BITMAPFILEHEADER结构开始到实际的图像数据之间的字节偏移量 */
}   BITMAPFILEHEADER;

 

(2)位图信息数据结构,它包含有BMP 图像的宽、高压缩方法,以及定义颜色等信息;

typedef struct tagBITMAPINFOHEADER { 
        DWORD    biSize;       /* 说明结构体所需字节数 */
        LONG        biWidth;   /* 以像素为单位说明图像的宽度 */
        LONG        biHeight;  /* 以像素为单位说明图像的高速 */
        WORD       biPlanes;   /* 说明位面数,必须为1 */
        WORD       biBitCount;  /* 说明位数/像素,1、2、4、8、24 */
        DWORD    biCompression;  /* 说明图像是否压缩及压缩类型 BI_RGB,BI_RLE8,BI_RLE4,BI_BITFIELDS */
        DWORD    biSizeImage;    /*  以字节为单位说明图像大小 ,必须是4的整数倍*/
        LONG        biXPelsPerMeter;    /*  目标设备的水平分辨率,像素/米 */
        LONG        biYPelsPerMeter;    /*目标设备的垂直分辨率,像素/米 */
        DWORD    biClrUsed;    /* 说明图像实际用到的颜色数,如果为0,则颜色数为2的biBitCount次方 */
        DWORD    biClrImportant;  /*说明对图像显示有重要影响的颜色索引的数目,如果是0,表示都重要*/
}  BITMAPINFOHEADER;


(3)调色板 ,相当于颜色的查找表。这个部分是可选的,有些位图需要调色板,称之为伪彩色;有些位图,比如真彩色( 24 位的 BMP)就不需要调色板。调色板实际上是一个数组,它所包含的元素与位图所具有的颜色数相同,决定于biClrUsed和biBitCount字段。数组中每个元素的类型是一个RGBQUAD结构。例如,1bit的位图,颜色数为2,其中"0"表示R0 G0 B0,"1"表示R255 G255 B255,则调色板应当包含这两个RGBQUAD结构,一共占用8个字节。

typedef struct tagRGBQUAD { 
       BYTE    rgbBlue;           /*指定蓝色分量*/
       BYTE    rgbGreen;        /*指定绿色分量*/
       BYTE    rgbRed;            /*指定红色分量*/
       BYTE    rgbReserved;   /*保留,指定为0*/
}  RGBQUAD;


(4)位图数据 ,这部分的内容根据BMP位图使用的位数不同而不同,在24位图中直接使用RGB,而其他的小于24位的使用调色板中颜色索引值。图像的每一扫描行由表示图像像素的连续的字节组成,每一行的字节数取决于图像的颜色数目和用像素表示的图像宽度。规定每一扫描行的字节数必须是4的整数倍,也就是DWORD对齐的。扫描行是由底向上存储的,这就是说,阵列中的第一个字节表示位图左下角的像素,而最后一个字节表示位图右上角的像素。

       依旧采用1bit位图来说明何为索引值:例如位图数据中存放的数据为“57”,转换为二进制数为“01010111”,1bit位图每次读取1位数据,第一次读出“0”,“0”作为索引值去调色板中查找,对应调色板中的R0 G0 B0颜色,通过调用调色板结构体,我们就能得到相应像素的RGB颜色分量。

       其中文件头、信息头、调色板的结构体在<windows.h>头文件中已经定义,用户可直接调用。 

2.二进制文件的读取和字节序问题

       我们可以用二进制形式打开两个BMP图像文件,更直观地了解图像文件结构。

       值得注意的是,不同的计算机系统采用不同的字节序存储数据 ,同样一个4字节的32 位整数 ,在内存中存储的方式不同 。字节序分为小尾字(Little Endian) 和大尾字节序 (Big Endian) 。BMP文件采用的的是小尾字节序保存方式,低位字节排放在内存的低端,高位字节排放在内存的高端,即“低位在前,高位在后”。

 

二进制编辑器                                        

0x00~0x01文件类型 

0x02~0x05文件大小

0x0a~0x0d实际数据的字节偏移量

42 4D(BM的ASCII码)

18 94 04 00(小尾字节序00 04 94 18 转换为十进制300056B)

36 00 00 00(54)

42 4D(BM的ASCII码)

08 DE 06 00(450056B)

36 00 00 00(54)

0x12~0x15图像宽度

0x16~0x19图像高度

2C 01 00 00(小尾字节序00 00 01 2C转换为十进制300)

F4 01 00 00(500)

2C 01 00 00(300)

F4 01 00 00(500)

0x1c~0x1d 图像位深度

10 00(16位) 18 00(24位)
0x22~0x25图像大小 E2 93 04 00(300002B) D2 DD 06 00(450002B)

0x26~0x29目标设备的水平分辨率

0x2a~0x2d目标设备的垂直分辨率

C3 0E 00 00(3779像素/米)

C3 0E 00 00(3779像素/米)

C3 0E 00 00(3779像素/米)

C3 0E 00 00(3779像素/米)

 

 注意:从上表二进制文件中读取的图像大小显然不是4的整数倍,这是因为BMP文件在存储时文件末尾留有了两个字节的保留位,而实际图像大小应当是4字节的整数倍。

            还可以验证出:实际数据偏移量+图像大小=文件大小     文件头+信息头+调色板大小=实际数据偏移量

            因为16bit、24bitBMP文件都没有用到调色板,所以它们的实际数据偏移量(36H)就是文件头(0x00~0x0d)加上信息头(28H)的大小。

 

二、实验流程分析

1.程序初始化(打开两个文件、定义变量和缓冲区等)

2.读取BMP文件,抽取或生成RGB数据写入缓冲区

3.调用RGB2YUV的函数实现RGB到YUV数据的转换
4.写YUV文件

5.程序收尾工作(关闭文件,释放缓冲区)

 

三、关键代码及分析

先设置工作目录和命令行参数:要达到最后的200帧YUV序列,我们可以共选用5张图片,让每张图片重复40帧

main.cpp

#include<windows.h>
/////包含相关头文件
int main(int argc,char** argv)
{
        ////定义相关变量、文件指针	
	int repeat_frame;////定义每张图像重复帧数
	yuvFileName=argv[6];
    repeat_frame=atoi(argv[7]);////在命令行参数中设置图像重复帧数,这里设置为40帧
	yuvFile = fopen(yuvFileName, "wb");
	////判断yuv文件是否能正常打开
	for(k=0;k<5;k++)////5次循环实现对5张图片的操作
	{
	bmpFileName=argv[1+k];
	bmpFile = fopen(bmpFileName, "rb");///依次打开5张图片
	////判断bmp文件是否能正常打开
   BITMAPFILEHEADER File_header;///定义文件头
   BITMAPINFOHEADER Info_header;///定义信息头
   if(fread(&File_header,sizeof(BITMAPFILEHEADER),1,bmpFile) != 1)////读取bmp文件文件头
 {
		printf("read file header error!");
		exit(0);
 }
if (File_header.bfType != 0x4D42)///判断是否为bmp文件
{
		printf("Not bmp file!");
		exit(0);
}
if(fread(&Info_header,sizeof(BITMAPINFOHEADER),1,bmpFile) != 1)///读取信息头
	{	printf("read info header error!");
		exit(0);}
	
//读取图像尺寸
int width = Info_header.biWidth;
int height = Info_header.biHeight;

	for(j=0;j<repeat_frame;j++)///设置每张图片重复帧数
	{

/////定义相应缓冲区
unsigned char* rgbBuf=(unsigned char*)malloc(width*height*3);
unsigned char* yBuf=(unsigned char*)malloc(width*height);
unsigned char* uBuf=(unsigned char*)malloc((width*height)/4);
unsigned char* vBuf=(unsigned char*)malloc((width*height)/4);

fseek(bmpFile,File_header.bfOffBits,0);///将文件指针指向实际数据开始处
if(bmp2rgb(File_header,Info_header,bmpFile,rgbBuf))////调用bmp2rgb函数
{
	printf("bmp2rgb error\n");
	exit(1);
}
int flip=0;////定义rgb2yuv函数中用到的顺序变量,flip=0时表示rgb文件为倒序存储
if(rgb2yuv(width,height,rgbBuf,yBuf,uBuf,vBuf,flip))////调用rgb2yuv函数
{
	printf("rgb2yuv error\n");
	exit(1);
}
////对yuvBUF的数据限定保护带
////调用fwrite函数将yuvBUF的数据依次写入yuvFile
////释放缓冲区,关闭文件
return 0;
}

       这里要注意的是帧数循环和图片循环的位置,因为每次文件读出与写入后文件指针都会相应地偏移到所操作的位置。设置每幅图循环帧数时,无需关闭、再次打开bmpFile和yuvFile,只用将rgbBuf、yBuf、uBuf、vBuf释放掉再重新开辟,用fseek函数将文件指针指向bmp文件实际数据处即可,即fseek(bmpFile,File_header.bfOffBits,0)。

       而设置5张图片循环时,循环内要将bmpFile先关闭,再重新打开下一张bmp图像文件,yuvFile不用关闭。


bmp2rgb.cpp

#include<windows.h>
#include<math.h>
////包含相关头文件

int i,j;

bool MakePalette(FILE * pFile,BITMAPFILEHEADER &file_h,BITMAPINFOHEADER & info_h,RGBQUAD *pRGB_out);////申明创建调色板函数


int bmp2rgb(BITMAPFILEHEADER &file_h,BITMAPINFOHEADER &info_h,
			FILE* pFile,unsigned char* rgbbuf)
{
///读取图像尺寸,以像素数为单位
int w,h;
w=info_h.biWidth;
h=info_h.biHeight;

unsigned char* dataBuf=(unsigned char*)malloc(w*h*info_h.biBitCount/8);///创建数据缓冲区dataBuf,以字节为单位
fseek(pFile,file_h.bfOffBits,0);///将文件指针指向实际数据位置
fread(dataBuf,1,w*h*info_h.biBitCount/8,pFile);///将相应字节大小的数据读入dataBuf


int Clr;///定义颜色数变量
if(info_h.biClrUsed==0)
{
Clr=pow(2,info_h.biBitCount);///若信息头中颜色数为0,则实际颜色数为2的位数次方
}
else
{
	Clr=info_h.biClrUsed;///若信息头中颜色数不为0,则为实际颜色数
}
switch(info_h.biBitCount)////用switch选择语句对不同的位数图像进行不同的操作
{
case 24:
	for(j=0;j<w*h;j++)
	{
			*rgbbuf=dataBuf[3*j];
			*(rgbbuf+1)=dataBuf[3*j+1];
			*(rgbbuf+2)=dataBuf[3*j+2];
			rgbbuf+=3;
	}
	break;
///24位图实际数据就是rgb分量值,每次提取一个字节数据,依次赋给相应像素的b、g、r分量
case 16:
	for(j=0;j<w*h*2;j+=2)
	{
	*rgbbuf = (dataBuf[j]&0x1F)<<3;
       *(rgbbuf + 1) = ((dataBuf[j]&0xE0)>>2)+((dataBuf[j+1]&0x03)<<6);
       *(rgbbuf + 2) = (dataBuf[j+1]&0x7C)<<1;
       rgbbuf +=3;
	}
    break;

    对于16bitBMP图像,它的颜色数据存储如下图:

      每个像素的RGB分量值一共占用两个字节,由于采用小尾字节序存储,先存储的是低字节,即G分量低3位和B分量,将低字节与0x1F(0001 1111)做与运算,得到低5位的B分量值,又将该值左移三位,数值范围扩展到0~248,再赋给rgbBuf的B分量。同样的方法可以取出R、G分量值。

 

default:

RGBQUAD *pRGB = (RGBQUAD *)malloc(sizeof(RGBQUAD)*Clr);///开辟一块RGBQUAD型调色板区域,RGBQUAD元素数目与所用颜色数相同,
//所以调色板大小为sizeof(RGBQUAD)*Clr

 if(!MakePalette(pFile,file_h,info_h,pRGB))///调用创建调色板函数
	printf("No palette!");

 for(j=0;j<w*h*info_h.biBitCount/8;j++)///以字节为单位遍历整个dataBuf
 {
	 unsigned char mask;///定义一个mask变量用来与每个字节做与运算,取得需要的位数数据
		 switch(info_h.biBitCount)
		 {
		 case 1://1bit
			 mask=0x80;//1000 0000
			 break;
		 case 2://2bit
			 mask=0xC0;//1100 0000
			 break;
		 case 4://4bit
			 mask=0xF0;//1111 0000
			 break;
		 case 8://8bit
			 mask=0xFF;//1111 1111
			 break;
		 }
		 int shiftCnt=1;//定义变量用来对mask移位计数
		 while(mask)
		 {
			 unsigned char index=mask==0xFF?dataBuf[j]:((dataBuf[j]&mask)>>(8-shiftCnt*info_h.biBitCount));
			* rgbbuf = pRGB[index].rgbBlue;
			* (rgbbuf+1) = pRGB[index].rgbGreen;
			* (rgbbuf+2) = pRGB[index].rgbRed;
			if(info_h.biBitCount == 8)	mask = 0;
			else 	mask >>= info_h.biBitCount;
			rgbbuf+=3;
			shiftCnt ++;
		 }
		 }
}
if(dataBuf!=NULL)
{
	free(dataBuf);
}  
return 0;
}


       若BMP图像位数小于或等于8位,位图数据中存储的是调色板的索引值,且该索引值不够一个字节,我们需要定义一个mask变量,相当于一个“蒙版”,通过与dataBuf中每个字节做与运算,取得想要的位数数据,然后通过蒙版移位,依次取得相应位数的数据。

       如果是8位图像,每次取得数据恰好一个字节,将相应的databuf字节作为索引值index,通过pRGB[index]调色板查找就能取得RGB分量值。

       如果图像位数小于8位,以2bit为例,初始蒙版为“1100 0000”,每次取得两位数据作为索引值。用ShiftCnt控制蒙版移位,第一次蒙版运算后得到“xx00 0000”,需要右移6位(8-1*2)将有效位移到低两位,得到“0000 00xx”作为索引值,获取第一个像素的RGB分量值后,将蒙版右移2位变成“0011 0000”再和dataBuf字节与运算得到“00xx 0000”,又右移4位(8-2*2)得到“0000 00xx”作为索引值。每操作完一个像素后,蒙版都向右移2位,蒙版与运算后再向右移(8-ShiftCnt*2)位后获得索引值。1bit、4bit位图同理推算,可得出:每操作完一个像素后,蒙版都向右移info_h.biBitCount位,蒙版与运算后再向右移(8-shiftCnt*info_h.biBitCount)位后获得索引值。

bool MakePalette(FILE * pFile,BITMAPFILEHEADER &file_h,BITMAPINFOHEADER & info_h,RGBQUAD *pRGB_out)///定义创建调色板函数
{
	int Clr;///定义颜色数变量
	if(info_h.biClrUsed==0)
	{
		Clr=pow(2,info_h.biBitCount);
	}
	else
	{
		Clr=info_h.biClrUsed;
	}

	if ((file_h.bfOffBits - sizeof(BITMAPFILEHEADER) - info_h.biSize) == sizeof(RGBQUAD)*Clr)///判断实际数据偏移量-文件头-信息头
		///是否等于调色板大小
	{
		fseek(pFile,sizeof(BITMAPFILEHEADER)+info_h.biSize,0);///将bmpFile文件指针指向调色板初始位置
		fread(pRGB_out,sizeof(RGBQUAD),Clr,pFile);///将bmpFile调色板数据读取到所开辟的调色板区
		return true;
	}
	else
		return false;
}

      rgb2yuv.cpp在上次实验报告中已经给出,直接添加到项目工程即可,注意bmp图像扫描行是从下往上,调用的是rgb2yuv函数中flip=0时的相关操作。项目工程中还需定义头文件包含对bmp2rgb、rgb2yuv函数的申明。

四、实验结果及分析

我们可以采用图像大小均为200*400,16bit、8bit、4bit图像各一张,24bit图像两张来验证程序,原图像为:

1_16bit 2_8bit 3_4bit
4_24bit 5_24bit  

令每张图片重复40帧,最终得到YUV图像序列共200帧,用YUV播放器查看,截取其中的图像如下:

1_16bit 2_8bit 3_4bit
4_24bit 5_24bit  
 

可以看到,原始图像与变换后生成的图像序列无明显差异,以此可证bmp2yuv程序是正确的。

 

五、实验总结

编程实现最终功能时可以由难到易分步进行,先实现一帧24bitbmp图像转yuv图像,然后添加帧数循环实现40帧yuv图像序列;接着实现16bit、1~8bit图像转换,再添加图像循环,依次将5张图片各循环40帧达到最后的yuv序列效果。

程序调试时遇到的问题和解决方法:

1.repeat_frame=atoi(argv[7])语句错用成(int)强制转换,使得生成的yuv序列每幅图的重复帧数出现错误。

2.创建调色板时,颜色数不能直接用信息头中的biClrUsed或者pow(2,info_h.biBitCount),要分情况讨论,当biClrUsed不等于0时,颜色数Clr才等于biClrUsed;否则Clr等于pow(2,info_h.biBitCount)。

3.最初将图像大小设置为300*500,4bit图像由于图像字节数300*500*4/8不能被4整除,导致图像失真。如下图:

4.16bit图像转yuv文件程序编写时,由于移位数判断出错,错写成*(rgbbuf + 1) = ((dataBuf[j]&0xE0)>>2)+((dataBuf[j+1]&0x03)<<5);

使得结果图像色调失真。如下图:

猜你喜欢

转载自blog.csdn.net/zgyggy/article/details/64922779