图像处理基本概念笔记（3）

著作权归作者所有。
商业转载请联系作者获得授权，非商业转载请注明出处。
作者：cvvision
链接：http://www.cvvision.cn/8910.html
来源：CV视觉网

三、 31、机器视觉基本功能

测量、定位、识别、检测

32、英寸 1英寸=25.4 mm 但是在CCD中间1英寸=16mm 比如：CCD尺寸1/3”：指CCD对角线长度为1/3英寸。说明：这是历史问题导致的，那时早期的电视摄像机使用的感光元件是真空管，现在常见的CCD和CMOS传感器，那时候还没发明出来呢。真空管的外面是有个玻璃罩子的，真空管外径是把玻璃厚度也算进去的。玻璃管当然是不能用于成像的，所以外径1英寸的真空管，实际成像区域只有16mm左右，于是16mm就成了电子摄像照相行业一个约定俗成的度量单位。虽然真空管成像技术现在已经不使用了，但是这种度量方式却被一直继承了下来。所以现在数码成像元件中提到英寸这个单位，都不能按工业标准的1英=25.4mm来计算，而要按1英寸=16mm来计算。

33、数字图像处理数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。又称为计算机图像处理，它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。主要目的：（1）提高图像的视感质量，如进行图像的亮度、彩色变换，增强、抑制某些成分，对图像进行几何变换等，以改善图像的质量。

（2）提取图像中所包含的某些特征或特殊信息，提取特征或信息的过程是模式识别或计算机视觉的预处理。

（3）图像数据的变换、编码和压缩，以便于图像的存储和传输。

常用方法：

1）图像变换：由于图像阵列很大，直接在空间域中进行处理，涉及计算量很大。如傅立叶变换、沃尔什变换、离散余弦变换等间接处理技术，将空间域的处理转换为变换域处理。

2 ）图像编码压缩：图像编码压缩技术可减少描述图像的数据量，以便节省图像传输、处理时间和减少所占用的存储器容量。

3 ）图像增强和复原：图像增强和复原的目的是为了提高图像的质量，如去除噪声，提高图像的清晰度等。

4 ）图像分割，将图像中有意义的特征部分提取出来，其有意义的特征有图像中的边缘、区域等，这是进一步进行图像识别、分析和理解的基础。

5 ）图像描述，作为最简单的二值图像可采用其几何特性描述物体的特性，一般图像的描述方法采用二维形状描述。

6 ）图像分类（识别），其主要内容是图像经过某些预处理（增强、复原、压缩）后，进行图像分割和特征提取，从而进行判决分类。基本特点：处理信息量很大、占用频带较宽、各像素相关性大、无法复现全部信息、受人的因素影响较大，看完百度百科的精简总结。

34、模拟/数字图像又称连续图像，是指在二维坐标系中连续变化的图像，即图像的像点是无限稠密的，同时具有灰度值（即图像从暗到亮的变化值）。连续图像的典型代表是由光学透镜系统获取的图像，如人物照片和景物照片等，有时又称模拟图像。模拟图像是通过某种物理量的强弱变化来表现图像上各个点的颜色信息的,印刷品图像、相片、画稿上的图像都是模拟图像。模拟图象是连续的点组成。数字图像：数字图像，是以二维数字组形式表示的图像，其数字单元为像元，数字图像的恰当应用通常需要数字图像与看到的现象之间关系的知识，也就是几何和光度学或者传感器校准，数字图像处理领域就是研究它们的变换算法。数字图像，又称数码图像或数位图像，是二维图像用有限数字数值像素的表示。由数组或矩阵表示，其光照位置和强度都是离散的。数字图像是由模拟图像数字化得到的、以像素为基本元素的、可以用数字计算机或数字电路存储和处理的图像。

对比度：一幅图像中最高和最低灰度级间的灰度差。高动态范围意味着高对比度。

灰度级：灰度级表明图像中不同灰度的最大数量。灰度级越大，图像的亮度范围越大。图像/空间分辨率：单位距离可分辨的最大线对数量/像素数。

灰度分辨率：灰度级中可分辨的最小变化。通常说一副被量化为256级的图像有8比特的灰度分辨率。

屏幕分辨率：屏幕分辨率是屏幕每行的像素点数*每列的像素点数，每个屏幕有自己的分辨率。屏幕分辨率越高，所呈现的色彩越多，清晰度越高。图像所需要的位数b：b=MxNxK MxN是空间分辨率，K灰度分辨率，单位是bit。图像深度：是指存储每个像素所用的位数，也用于量度图像的色彩分辨率。图像深度确定彩色图像的每个像素可能有的颜色[数，或者确定灰度图像的每个像素可能有的灰度级数.它决定了彩色图像中可出现的最多颜色数，或灰度图像中的最大灰度等级。比如一幅单色图像,若每个像素有8位，则最大灰度数目为2的8次方,即256。一幅彩色图像RGB3个分量的像素位数分别为4,4,2,则最大颜色数目为2的4+4+2次方，即1024,就是说像素的深度为10位，每个像素可以是1024种颜色中的一种。图像采样：对图像空间坐标的离散化，它决定了图像的空间分辨率。采样的实质就是要用多少点来描述一幅图像，采样结果质量的高低就是用前面所说的图像分辨率来衡量。简单来讲，对二维空间上连续的图像在水平和垂直方向上等间距地分割成矩形网状结构，所形成的微小方格称为像素点。一副图像就被采样成有限个像素点构成的集合。例如：一副640*480分辨率的图像，表示这幅图像是由640*480＝307200个像素点组成。

位图：也称点阵图，它是由许多点组成的，这些点称为像素。当许多不同颜色的点组合在一起后，便构成了一副完整的图像。位图可以记录每一个点的数据信息，从而精确地制作色彩和色调变化丰富的图像。但是，由于位图图像与分辨率有关，它所包含的图像像素数目是一定的，若将图像放大到一定程度后，图像就会失真，边缘出现锯齿。深度：深度即位数（比特数）

①位深：一个像素点所占的总位数，也叫像素深度、图像深度等，其中位深 = 通道数 × 每个通道所占位数

②256色图：n位的像素点可以表示2^n种颜色，称2^n色图，n=8时为256色图

③8位RGB与8位图：前者的位数指每个通道所占的位数，后者指整个像素点共占的位数，其中8位RGB是一个24位图，也称为真彩。

对比度：指不同颜色之间的差别。对比度越大，不同颜色之间的反差越大，即所谓黑白分明，对比度过大，图像就会显得很刺眼。对比度越小，不同颜色之间的反差就越小。对比度=最大灰度值/最小灰度值。

亮度：指照射在景物或图像上光线的明暗程度。图像亮度增加时，就会显得耀眼或刺眼，亮度越小时，图像就会显得灰暗。频率：灰度值变化剧烈程度的指标，是灰度在平面空间上的梯度。低频就是颜色缓慢地变化,也就是灰度缓慢地变化,就代表着那是连续渐变的一块区域,这部分就是低频。高频就是频率变化快，即相邻区域之间灰度相差很大,这就是变化得快。图像中,一个影像与背景的边缘部位的频率高，即高频显示图像边缘。图像的细节处也是属于灰度值急剧变化的区域，正是因为灰度值的急剧变化，才会出现细节。另外噪声（即噪点）也是这样,在一个像素所在的位置,之所以是噪点,就是因为它与正常的点颜色不一样了，灰度有了快速地变化。固有“图像的低频是轮廓，高频是噪声和细节”。空域：也叫空间域，即所说的像素域，在空域的处理就是在像素级的处理，如在像素级的图像叠加。通过傅立叶变换后，得到的是图像的频谱。表示图像的能量梯度。频域：也叫频率域，任何一个波形都可以分解成多个正弦波之和。每个正弦波都有自己的频率和振幅。所以任意一个波形信号有自己的频率和振幅的集合。频率域就是空间域经过傅立叶变换的信号。

36、数字图像类型黑白图像：图像的每个像素只能是黑或白，没有中间的过渡，故又称为二值图像。二值图像的像素值只有0.1。灰度图像：灰度图像是每个像素的信息由一个量化的灰度级来描述图像，没有彩色信息。彩色图像：彩色图像是指每个像素的信息由RGB三原色构成的图像，其中RBG是由不同的灰度级来描述的。序列图像：把具有一定联系的、具有时间先后关系的图像称为序列图像。我们经常看到的电视剧或电影图像主要是由序列图像构成的。序列图像是数字多媒体的重要组成部分。序列图像是单幅数字图像在时间轴上的扩展，可以将视频的每一帧视为一幅静止的图像。

37、采样/量化/色彩/直方图采样对连续的2D信号（图像）进行采样，将依据预先定义的行数和列数得到一个完整的二维信号数组。给定行和列相交处的点（元素）称为像素。采样原始图像是一个有损操作-采样图像的质量取决于预设的采样水平。用不同采样等级得到的图像量化量化等级表示的是在数字图像中,每个像素的取值范围.常用的量化等级有2,64,256,1024,4096,16384等等。举例来说，如果我们使用1024个量化等级，那么在图像中每个像素可能的取值就是0~1023中的某个数。使用不同量化等级得到的图像色彩对数字图像来说，最后一个要素是每个像素的色彩。当前最流行的色彩模型是RGB模型，我们用红绿蓝3个颜色分量来表示任意一种颜色。在RGB模式图像中，每个像素点包含了其在3个颜色分量下的饱和度。另一个常用的色彩模型是HSV，HSV模型同样使用3个分量来表示色彩：色调，饱和度，明度.这个模型可以在颜色空间中表示为一个圆锥形。在印刷行业，最受欢迎的颜色模式是CMYK，它包含4种基本颜色:青,品红,黄,黑,它们互相调和形成最终的颜色. 直方图图像直方图是图像中每种颜色或亮度等级发生次数的统计信息。直方图告诉我们很多关于图像的信息—-不仅限于亮度和对比度。使用直方图，我们可以判断图像细节是否已被正确捕获和存储。在分析彩色图像时，我们接收每个颜色的直方图（RGB）。灰度图像则使用单一的直方图。彩色和灰度图像的直方图

38、数据量与信息量数据量，就是一张图像占了多少个字节，比如1万个像素，每个像素占1个字节，那未压缩前的数据量就是 1万个字节。信息量，信息量表示一张图片里包含了多少种信息。假如一张全白的图片，它只有”白色”这个信息，那么它的信息量就很小，白色像素出现的概率是1，非常大。这样的图片不管它数据量再大，假设是1万乘1万的大小，都可以压缩到很小的程度。假如一张五颜六色的图片，里面包含很多不同的颜色信息，说明它信息量很大，那么就很难被压缩了。

39、图像处理和计算机视觉的分类关于图像处理，图像分析和计算机视觉的划分并没有一个很统一的标准。按照当前流行的分类方法，分为三部分： A.图像处理：对输入的图像做某种变换，输出仍然是图像，基本不涉及或者很少涉及图像内容的分析。比较典型的有图像变换，图像增强，图像去噪，图像压缩，图像恢复，二值图像处理等等。基于阈值的图像分割也属于图像处理的范畴。一般处理的是单幅图像。 B.图像分析：对图像的内容进行分析，提取有意义的特征，以便于后续的处理。处理的仍然是单幅图像。 C.计算机视觉：对图像分析得到的特征进行分析，提取场景的语义表示，让计算机具有人眼和人脑的能力。这时处理的是多幅图像或者序列图像，当然也包括部分单幅图像。

40、选取相机相机还应该提供：相机功能和成像质量。一台好相机决不只是像素数高。您还应该考虑到成像质量和相机功能。在评估数字相机的成像质量时，重要因素除分辨率外，还包括感光度、动态范围及信噪比。就相机功能来说，最重要的功能之一是速度，通常以每秒帧数(fps)来表示。它定义每秒能够记录的最大帧数

41、图像内插图像内插：已知数据来估计未知位置的数值的处理。在放大、缩放、旋转和几何校正中广泛使用，是基本的重取样方法。最近邻内插法：假设一幅图像大小为500×500像素，将其放大1.5倍到750×750像素。创建一个假想的750×750的网格，它与原始图像有相同的间隔，然后将收缩，使它准确地与原图匹配。此时750×750的网格的像素要小于原图像的像素间隔，在原图像中寻找最接近的像素，并把该像素的灰度赋给750×750网格中的新对象。然后将图像扩展到原来规定的大小，得到放大后的图像。这种方法简单，但可能产生不希望的结果，如直边缘的严重失真。双线性内插：用4个最近邻去估计给定位置的灰度。令(x, y)为想要赋以灰度值的位置的坐标，并令v(x, y)表示灰度值，对于双线性内插来说，赋值公式为： v(x,y)=ax+by+cxy+d 4个系数由4个用(x, y)点最近邻点写出的未知方程确定。双三次内插：用16个最近邻点去估计给定位置的灰度。公式如下： v(x,y)=∑i=03∑j=03aijxiyj 当上限为1时，该方程与双线性内插方法是一致的。双三次内插是商业图像编辑程序的标准内插方法。相邻像素：位于坐标(x, y)处的像素p有4个水平和垂直的相邻像素，其坐标由为： (x+1,y),(x−1,y),(x,y+1),(x,y−1) 这组像素称为p的4领域(4-neighbors of p)，用N4(p)表示。 p的4个对角(diagonal)相邻像素坐标为： (x+1,y+1),(x+1,y−1),(x−1,y+1),(x−1,y−1) 用ND(p)表示。这些点与4个邻点一起称为p的8邻域(8-neighbors of p)。用N8(p)表示。如果(x, y)位于图像的边界上，某些邻点会落入图像的外边。

三、

31、机器视觉基本功能测量、定位、识别、检测

（2）提取图像中所包含的某些特征或特殊信息，提取特征或信息的过程是模式识别或计算机视觉的预处理。

（3）图像数据的变换、编码和压缩，以便于图像的存储和传输。

常用方法：

2 ）图像编码压缩：图像编码压缩技术可减少描述图像的数据量，以便节省图像传输、处理时间和减少所占用的存储器容量。

3 ）图像增强和复原：图像增强和复原的目的是为了提高图像的质量，如去除噪声，提高图像的清晰度等。

4 ）图像分割，将图像中有意义的特征部分提取出来，其有意义的特征有图像中的边缘、区域等，这是进一步进行图像识别、分析和理解的基础。

5 ）图像描述，作为最简单的二值图像可采用其几何特性描述物体的特性，一般图像的描述方法采用二维形状描述。

35、像素/分辨率/深度等像素：由一个数字序列表示的图像中的一个最小单位。可以理解为一个二维数组的一个元素，其值大小表示灰度（强度）灰度：灰度是表明图像明暗的数值，即黑白图像中点的颜色深度，范围一般从0到255，白色为255 ，黑色为0，故黑白图片也称灰度图像。灰度值指的是单个像素点的亮度。灰度值越大表示越亮。动态范围：系统中最大可度量灰度与最小可检测灰度之比。上限取决于饱和度，下限取决于噪声。对比度：一幅图像中最高和最低灰度级间的灰度差。高动态范围意味着高对比度。灰度级：灰度级表明图像中不同灰度的最大数量。灰度级越大，图像的亮度范围越大。图像/空间分辨率：单位距离可分辨的最大线对数量/像素数。灰度分辨率：灰度级中可分辨的最小变化。通常说一副被量化为256级的图像有8比特的灰度分辨率。屏幕分辨率：屏幕分辨率是屏幕每行的像素点数*每列的像素点数，每个屏幕有自己的分辨率。屏幕分辨率越高，所呈现的色彩越多，清晰度越高。图像所需要的位数b：b=MxNxK MxN是空间分辨率，K灰度分辨率，单位是bit。图像深度：是指存储每个像素所用的位数，也用于量度图像的色彩分辨率。图像深度确定彩色图像的每个像素可能有的颜色[数，或者确定灰度图像的每个像素可能有的灰度级数.它决定了彩色图像中可出现的最多颜色数，或灰度图像中的最大灰度等级。比如一幅单色图像,若每个像素有8位，则最大灰度数目为2的8次方,即256。一幅彩色图像RGB3个分量的像素位数分别为4,4,2,则最大颜色数目为2的4+4+2次方，即1024,就是说像素的深度为10位，每个像素可以是1024种颜色中的一种。图像采样：对图像空间坐标的离散化，它决定了图像的空间分辨率。采样的实质就是要用多少点来描述一幅图像，采样结果质量的高低就是用前面所说的图像分辨率来衡量。简单来讲，对二维空间上连续的图像在水平和垂直方向上等间距地分割成矩形网状结构，所形成的微小方格称为像素点。一副图像就被采样成有限个像素点构成的集合。例如：一副640*480分辨率的图像，表示这幅图像是由640*480＝307200个像素点组成。位图：也称点阵图，它是由许多点组成的，这些点称为像素。当许多不同颜色的点组合在一起后，便构成了一副完整的图像。位图可以记录每一个点的数据信息，从而精确地制作色彩和色调变化丰富的图像。但是，由于位图图像与分辨率有关，它所包含的图像像素数目是一定的，若将图像放大到一定程度后，图像就会失真，边缘出现锯齿。深度：深度即位数（比特数）①位深：一个像素点所占的总位数，也叫像素深度、图像深度等，其中位深 = 通道数 × 每个通道所占位数 ②256色图：n位的像素点可以表示2^n种颜色，称2^n色图，n=8时为256色图 ③8位RGB与8位图：前者的位数指每个通道所占的位数，后者指整个像素点共占的位数，其中8位RGB是一个24位图，也称为真彩。对比度：指不同颜色之间的差别。对比度越大，不同颜色之间的反差越大，即所谓黑白分明，对比度过大，图像就会显得很刺眼。对比度越小，不同颜色之间的反差就越小。对比度=最大灰度值/最小灰度值。亮度：指照射在景物或图像上光线的明暗程度。图像亮度增加时，就会显得耀眼或刺眼，亮度越小时，图像就会显得灰暗。频率：灰度值变化剧烈程度的指标，是灰度在平面空间上的梯度。低频就是颜色缓慢地变化,也就是灰度缓慢地变化,就代表着那是连续渐变的一块区域,这部分就是低频。高频就是频率变化快，即相邻区域之间灰度相差很大,这就是变化得快。图像中,一个影像与背景的边缘部位的频率高，即高频显示图像边缘。图像的细节处也是属于灰度值急剧变化的区域，正是因为灰度值的急剧变化，才会出现细节。另外噪声（即噪点）也是这样,在一个像素所在的位置,之所以是噪点,就是因为它与正常的点颜色不一样了，灰度有了快速地变化。固有“图像的低频是轮廓，高频是噪声和细节”。空域：也叫空间域，即所说的像素域，在空域的处理就是在像素级的处理，如在像素级的图像叠加。通过傅立叶变换后，得到的是图像的频谱。表示图像的能量梯度。频域：也叫频率域，任何一个波形都可以分解成多个正弦波之和。每个正弦波都有自己的频率和振幅。所以任意一个波形信号有自己的频率和振幅的集合。频率域就是空间域经过傅立叶变换的信号。

图像处理基本概念笔记（3）

猜你喜欢