【计算机视觉】第2章 数字图像处理基础

文章目录

0 学习目标

了解人类视觉的一些重要功能和限制。
熟悉电磁能谱,包括光的基本性质
了解如何产生和表示数字图像
理解图像取样与量化的基本知识。
熟悉空间和灰度分辨率及它们对图像外观的影响
了解图像像素间的基本几何关系
熟悉数字图像处理所用的主要数学工具
能够应用多种入门的数字图像处理技术。

1 视觉感知要素

图像如何形成?
人类如何感知图像?

1.1 人眼结构

在这里插入图片描述
眼睛聚焦时,来自物体的光在视网膜上成像。模式视觉由分布在视网膜表面上的各个分立光感受器提供。

光感受器-锥状体和杆状体

光感受器分为两类: 锥状体和杆状体。

锥状体:每只眼睛中的锥状体约有 600~700 万个,主要分布在视网膜中称为中央凹的中间部分,并且对颜色高度敏感。人们之所以能够充分地分辨图像的细节,原因在于每个锥状体都连接到了自身的神经末梢。肌肉控制眼球的转动,使感兴趣区域的图像落到中央凹上。锥状体视觉称为明视觉或亮视觉

杆状体:杆状体的数量非常多,视网膜上分布有 7500~15000 万个杆状体。由于分布面积大且几个杆状体连接到一个神经末梢,因此降低了这些感受器感知细节的能力。杆状体捕获视野内的整个图像。它们没有色觉对低光照度敏感。例如,白天色彩鲜艳的物体在月光下却没有颜色,因为此时只有杆状体受到刺激。这种现象称为暗视觉或微光视觉

在这里插入图片描述

图 2.2显示了通过右眼视神经区的剖面的杆状体和锥状体密度。在盲点区域,由于没有感受器而导致了所谓的盲点(见图 2.1)。除盲点区域外,感受器的分布关于中央凹径向对称。感受器密度根据到视轴的度数来度量。注意,图 2.2 中的锥状体在视网膜的中心最密从该中心向外到偏离视轴约20°处,杆状体的密度逐渐增大。向外到视网膜的边缘处,它们的密度逐渐降低。

1.2 人眼中图像的形成

在这里插入图片描述

在普通照相机中,镜头的焦距是固定的。不同距离的聚焦是通过改变镜头和成像平面之间的距离来实现的,胶片(或数码相机的成像芯片)放在成像平面上。

在人眼中,情况与此相反:**晶状体和成像区域(视网膜)之间的距离是固定的,正确聚焦的焦距是通过改变晶状体的形状得到的。在远离或接近目标时,睫状体中的纤维通过分别压扁或加厚晶状体来实现聚焦。**晶状体中心和沿视轴的视网膜之间的距离约为 17mm。焦距的范围为 14~17mm。眼睛放松并注视的距离大于3m时,焦距约为17mm。

图2.3中的几何关系说明了在视网膜上所形成的图像的尺寸。例如,假设某人正在观看 100m外高15m的一棵树。令h表示视网膜图像中该物体的高度,由图2.3的几何关系可得 15/100= h/17或h=2.5mm。

视网膜图像主要聚焦在中央凹区域。然后,光感受器的相对激励作用产生感知,把辐射能量转换为最终由大脑解码的电脉冲。

1.3 亮度适应与辨别

亮度适应现象:人眼通过改变其整体灵敏度来适应非常大的光强变动范围的现象。

亮度适应水平:对于给定的一组条件,视觉系统的当前灵敏度水平称为亮度适应水平。

主观亮度:人的视觉系统感觉到的亮度,是进入眼内的光强度的对数函数。

在这里插入图片描述

例如在图 2.4 中,它对应于亮度 Ba。短交线表示适应这一亮度水平时人眼所能感知的主观亮度范围。当然,这一范围严格受限,水平Bb或低于水平Ba的刺激都感知为不可辨别的黑色。曲线的上部实际上不受限,但延伸太远也会失去意义,因为亮度更高会使得适应水平高于 Ba。

人眼对比灵敏度

Δ I \Delta I ΔI 不够亮时,目标给出响应“否”,表明没有可觉察的变化。 Δ I \Delta I ΔI 逐渐变强时,目标给出肯定的响应“是”,表明有可觉察的变化。最后,当 Δ I \Delta I ΔI 足够强时,目标始终给出肯定的响应“是”。

Δ I / I \Delta I/I ΔI/I 称为韦伯比,其中 Δ I \Delta I ΔI 是背景照射为 I I I时50%时间可辨别的照射增量。

较小的 Δ I / I \Delta I/I ΔI/I 值意味着可辨别亮度小百分比变化。这表示“较好”的亮度辨别能力。相反,较大的 Δ I / I \Delta I/I ΔI/I 值意味着人眼检测变化时要求较大百分比的亮度变化。这表示“较差”的亮度辨别能力。

在这里插入图片描述

对比灵敏度:实验表明,人眼睛刚能分辨的强度差 Δ I \Delta I ΔI I I I 的函数,而且韦伯分数 Δ I / I \Delta I/I ΔI/I 在相当宽的范围内近似为常数,约等于0.02。

在这里插入图片描述

上述的情况是背景为 I I I,韦伯比是 Δ I / I \Delta I/I ΔI/I,韦伯比是背景 I I I的函数。

下面的情况是背景为 I 0 I_0 I0,韦伯比是 Δ I / I \Delta I/I ΔI/I,韦伯比是背景 I 0 I_0 I0的函数。

在这里插入图片描述
在这里插入图片描述

I 0 I_0 I0不同,函数曲线不同,但整体的轮廓(图中虚线)仍然是在相当宽的范围内近似为常数,仍约等于0.02。

马赫带效应(Mach Band)

人类视觉系统有趋向于过高或过低估计不同亮度区域边界值的现象。

在这里插入图片描述

为什么人眼会产生马赫带效应?

人们之所以能够充分地分辨图像的细节,原因在于每个锥状体都连接到了自身的神经末梢。人眼区分物体形状依靠锥状体,而锥状体的敏感度变化与离心距的关系是钟型曲线,锥状体中心区域敏感度高,锥状体边缘区域敏感度低。

![在这里插入图片描述](https://img-blog.csdnimg.cn/b773d29d4b454c2697e0572cd0de7469.png =200xx)

当光强变化时,变化边界的光强在锥状体的中心区域会很敏感,所以光强感受曲线会有凸起和凹陷。

在这里插入图片描述 在这里插入图片描述

马赫带效应可以看做一种滤波,人眼结构光后,经过该种滤波再将光信号传递给大脑。

同时对比度

人眼睛无法判断出视场中目标物的绝对亮度。因为人类视觉对亮度的主观响应不仅与目标物的亮度有关,而且与目标物的背景亮度也有密切关系。

在这里插入图片描述

上图中,中心区域的强度相同,但背景逐渐变亮,导致中心区域看起来逐渐变暗。

空间错觉和假轮廓

在这里插入图片描述

人类感知现象的另一些例子是光学错视,即人眼中充斥着不存在的信息或错误地感知了物体的几何特点。图 2.9显示了一些例子。在图 2.9(a)中,正方形的轮廓看起来很清楚,但没有任何线条将这样的图形定义为图像的一部分。在图 2.9(b)中可以看到相同的效应,但这次是一个圆;注意,几条直线就足以给出一个完整圆的错视。图 2.9©中的两条水平线段的长度相同,但看起来一条显得比另一条短。最后,图 2.9(d)中所有的直线都是等间距的平行线,但画有交叉线时就会使人产生这些直线不再平行的错视。

1.4 思考

思考1:视觉过程 - 人类如何视觉感知?

视觉过程分为三个子过程:光学过程、化学过程和神经处理过程。

在这里插入图片描述

视觉是一个复杂的过程,涉及光学、几何学、化学、生理学、心理学等多个方面的知识。例如,从光源发出辐射到大脑获得场景信息涉及一系列步骤(见图1-1):

  • 光源照射到客观世界的物体上并发生反射(可能还有折射、透射),遵循一定的光学规律进入人眼;
  • 人眼接收到的辐射能量会经过人眼内的折光系统(包括晶状体、瞳孔、角膜、房水、玻璃体等)并最终按照几何规律成像于视网膜上;
  • 视网膜上的感光细胞受到刺激并产生响应,将光能量根据化学反应的规律转换为相应的神经信号(将光刺激所包含的视觉信息转变成神经信息);
  • 这些神经信号按照生理学的规律在人体的神经通道内传递,将信息送入大脑;
  • 在大脑视觉中枢的处理和加工下,结合心理学的规律,人才能获得对场景的认知、解释信息(如外界物体的大小、位置、明暗、颜色、动静、趋向、态势等)。

在这里插入图片描述

光学过程

光学过程的物理基础是人眼。从成像的角度可将眼睛和相机进行简单比拟。

眼睛本身是一个平均直径约为20mm的球体,球体前端有一个晶状体,对应相机的镜头
晶状体前的瞳孔对应相机的光圈控制进入眼睛的光通量
球体内壁有一层视网膜,它是含有光感受器和神经组织网络的薄膜,对应相机中传感器的感光面(早期相机内的胶片)。

外来光线在通过瞳孔后被晶状体聚焦而在视网膜上成像。

光学过程基本确定了成像的尺寸,这可借助图1-2来说明。晶状体的屈光能力从最小变到最大时,晶状体聚焦中心和视网膜间的距离可以从约17mm变到约14mm。以17mm为例,在观察一个100m外高度为15m的柱状物体时,如果用x表示以mm为单位的视网膜上的成像尺寸,根据图1-2中的几何关系,15/100=x/17,可算得x=2.55(mm)。

在这里插入图片描述

化学过程

视网膜表面分布着许多光接收细胞(感光单元),它们可接收光的能量并形成视觉图案。光接收细胞分为两类:锥细胞和柱细胞。

锥细胞和柱细胞均由色素分子组成,其中含有可吸收光的视紫红质这种物质在吸收光后会产生化学反应而分解。一旦化学反应发生,分子就不再吸收光。反之,如果不再有光通过视网膜,化学反应就反过来进行,分子可重新工作(这个转换过程通常需要几十分钟才能全部完成)

当光通量增加时,受到照射的视网膜细胞数量随之增加,分解视紫红质的化学反应增强,从而使产生的神经元信号变得更强。从这个角度来看,可将视网膜看作一个化学实验室,在其中将光学影像通过化学反应转换成其他形式的信息。视网膜各处产生的信号的强度反映了场景中对应位置的光强度。由此可见,化学过程基本确定了成像的亮度或颜色

神经处理过程

神经处理过程在大脑中枢神经系统里进行。
(1)借助突触,每个视网膜接收单元都与一个神经元细胞相连,每个神经元细胞借助其他突触再与其他细胞连接,从而构成光神经网络。
(2)光神经网络进一步与大脑中的侧区域连接,并连接大脑中的纹状皮层。在纹状皮层中,对光刺激产生的感觉响应经过一系列处理最终形成关于场景的表象,从而将对光的感觉转化为对场景的知觉响应。
(3)在大脑皮层中要完成一系列处理工作(从图像存储到做出响应等)。

2 光与电磁波谱

3 图像感知与获取

在这里插入图片描述
在这里插入图片描述

采集数字图像需要使用专门的图像采集装置。所有图像采集装置的共同之处是要接收外界的激励并产生(连续的)模拟响应,然后把模拟响应转化为数字信号,从而可被计算机利用。

所以图像采集装置需要具备两种器件。一种是对某种电磁波(如X射线、紫外线、可见光、红外线等)敏感的物理器件,它可以接收辐射并产生与接收到的辐射能量成正比的(模拟)电信号。近年来使用的对电磁波敏感的物理器件主要是电荷耦合器件(CCD)互补金属氧化物半导体(CMOS),它们构成的固态平面传感器阵有一个显著特点,即具有非常高的快门速度(可达10-4s),能将许多运动定格。另一种是数字化器件,它能将输入的(模拟)电信号转化为数字(离散)形式(模数转换),从而输入计算机。

3.1 传感器

胶片(化学反应)

在这里插入图片描述

电荷合器件CCD(Charge Coupled Device)

将光能量转换为电荷,并将转换得到的电荷进行存储。

  • 线阵式,扫描仪
  • 阵列式,数码相机

在这里插入图片描述

CCD芯片工作方式

  1. 光电转换装置把入射到每一个感光像素上的光了转化为相应数量的电荷;
  2. 电荷被储存起来;
  3. 电荷有序地转移出感光区域;
  4. 电荷经放大器袋化为电压量。

CCD传感器中每一行中每一个像素的电荷数据都会依次传送到下一个像素中,由最底端部分输出,再经由传感器边缘的放大器进行放大输出。

按几何组织形式分为两种:线扫描传感器和平面扫描传感器。

CMOS金属-氧化物-半导体(Metal-Oxide-Semiconductor)

P型MOS管
N型MOS管

在这里插入图片描述

放大器Amplifier;感光基元Photosites。

CMIOS传感器中,每个像素都会邻接一个放大器及A/D转换电路,用类似内存电路的方式将数据输出。

CCD:在灵敏度、解析度、分辨率、噪声控制、成像等方面都优于CMOS传感器:
CMOS:低成本、低功耗、以及高整合度的特点(因为每个感光基元都接一个放大器,感光原件不紧凑,使得分辨率、解析度和灵敏度等都收到影响)。如果跳脱尺寸限制,目前业界的CMOS 感光原件已经可达到1400万像素/全片幅的设计,CMOS技术在量率上的优势可以克服大尺寸感光原件制造上的困难。随着CCD与CMIOS传感器技术的进步,两者的差异有逐渐缩小的态势。

常用性能指标

对各种图像采集装置来说,在使用中经常考虑的性能指标主要有以下几项。
(1)线性响应:输入物理信号的强度与输出响应信号的强度之间是否具有线性关系。
(2)灵敏度:绝对灵敏度可用所能检测到的最少光子个数表示,相对灵敏度可用输出信号强度发生单级变化所需的光子个数表示。
(3)信噪比:采集的图像中有用信号与无用干扰的比值(能量或强度)。
(4)阴影(不均匀度):指输入的物理信号幅度为常数而输出的数值不为常数的现象。
(5)快门速度:采集一幅图像所需的拍摄/曝光时间。
(6)读取速率:信号数据从光敏单元读取的速率。

3.2 成像方式

在这里插入图片描述

单个传感器获取图像

在这里插入图片描述

条带传感器获取图像

在这里插入图片描述

阵列传感器获取图像

在这里插入图片描述

3.3 成像模型

用形如 f ( x , y ) f(x,y) f(x,y)的二维函数来表示图像。在空间坐标 ( x , y ) (x,y) (x,y)处的值是一个标量其物理意义由图像源决定,其值与物理源(如电磁波)辐射的能量成正比。因此, f ( x , y ) f(x,y) f(x,y)一定是非负的和有限的,即

f ( x , y ) = i ( x , y ) r ( x , y ) , 0 ≤ f ( x , y ) < ∞ , 0 ≤ i ( x , y ) < ∞ , 0 ≤ r ( x , y ) ≤ 1 f(x,y)=i(x,y)r(x,y), 0\le f(x,y)\lt \infty, 0\le i(x,y)\lt \infty, 0\le r(x,y)\le 1 f(x,y)=i(x,y)r(x,y),0f(x,y)<,0i(x,y)<,0r(x,y)1

函数 f(x,y) 由两个分量表征:
(1)入射分量 i ( x , y ) i(x,y) i(x,y):入射到被观察场景的光源照射量;
(2) 反射分量 r ( x , y ) r(x,y) r(x,y):被场景中物体反射的照射量。

反射分量限制在0(全吸收)和1(全反射)之间。 i ( x , y ) i(x,y) i(x,y)的性质取决于照射源,而 r ( x , y ) r(x,y) r(x,y)的性质取决于被成像物体的特性。这些表达式也适用于透射成像的情况,如胸透X射线。这时,要用透射系数代替反射函数。

为什么 f ( x , y ) f(x,y) f(x,y)一定是非负?
图像亮度在加工过程中可变为负值,或者作为解释的结果。例如,在雷达图像中,向雷达运动的物体通常被解释为具有负速度,而离雷达而去的物体被解释为具有正速度。因此,速度图像可编码为具有正负值。存储和显示图像时,通常会缩放亮度,使最小的负值变为0。

灰度级

![在这里插入图片描述![](https://img-blog.csdnimg.cn/748477cb66cd4225b5b69ad319461e46.png)

4 图像取样与量化

4.1 图像数字化(digitizing-scanning/sampling and quantization)

物理图像—可用连续函数进行较好地描述、分析与处理
数字图像—时空与幅度均为离散的数据矩阵
"分辨率:在一定的面积内取多少个点,或者多少个像素;
“数据深度”:记录每个点的某一因素(亮度/色度)的数据位数。
将模拟图像经过离散化之后,得到用数字表示的图像。一般包含三个步骤:采样、量化和编码。

采样:对坐标值数字化。
量化:对幅度值数字化。

量化精度高度依赖采样信号中的噪声含量。
数字图像质量很大程度上取决于取样和量化中所用的样本数和离散灰度级。

在这里插入图片描述
在这里插入图片描述

4.2 采样(取样)、量化与编码

采样

在这里插入图片描述

采样:将在空间上连续的图像转换成离散的采样点(即像素)集的操作

在这里插入图片描述

采样间隔太小,则增大数据量;采样间隔太大,则会发生信息的导致细节无法辨认混叠

一维Nyquist采样定理:如果一维信号x(t) 是频带受限信号,其最高频率为fc,当采样频率满足 fs ≥2fc 时,则原信号可由离散样点值精确重建。

二维Nyguist采样定理:原始图像在水平方向的频率为um,在垂直方向的频率为vm,只要水平方向的空间采样频率u0≥2um,垂直方向的空间采样频率v0≥2vm,即采样点的水平间隔Δx≤(1/2um) ,垂直间隔Δy≤(1/2vm) ,则图像可被精确地恢复。

可见当量化层数 K 加大,则每层长度 L 缩小,总的均方误差也成平方比例缩小,更有利于保持原图的灰度信息。

Nyquist-Shannon采样定理
这是一个各个轴之间间隔45度的轮子,每个轮子都被标上了标识
在这里插入图片描述
假设这个轮子以每秒45度来转动,那么每个轴返回原位需要8秒 (采样周期Q)。
那么如果每8,16,24秒来用相机拍照,是不是每次都可以拍摄到原图像静止不动?这是因为在采样周期内,车轮旋转的整数周期都会回到原位,不论旋转方向如何。那么就有了一个非常重要的结论:
采样周期的整数倍不能检测到相位(状态)变化
减少一点拍摄周期,如果以每4秒的速度拍摄呢?
每4秒拍照一次,轮子只能转一半,那么可以在照片中检测到轮子正在旋转,虽然依然不能区分它的旋转方向,但是轮子的状态 (相位) 已经可以区分了。
那么再减少一点拍摄周期,以每3秒的速度拍摄呢?
无论顺时针还是逆时针,都可以看到轮轴的错位(相位的变化)
这就是Nyquist-Shannon采样定理,我们希望同时看到轮子的旋转和相位变化,采样周期要小于整数周期的1/2,采样频率应该大于原始频率的2倍。同理,对于模拟信号,我们希望同时看到信号的各种特性,采样频率应该大于原始模拟信号的最大频率的两倍,否则将发生混叠(相位/频率模糊)
参考:怎样理解Nyquist采样定理? - 甜草莓的回答 - 知乎

图像空间分辨率变化时的参数设置
在这里插入图片描述

图像空间分辨率变化的效果
在这里插入图片描述

在这里插入图片描述

量化

量化:把采样后所得的各像素的灰度值从模拟量到离散量的转换称为图像灰度的量化。
在这里插入图片描述

在这里插入图片描述

当图像的采样点数一定时,采用不同量化级数的图像质量也不一样。量化级数越多,图像质量越好,当量化级数越少时,图像质量越差,量化级数最小的极端情况就是二值图像图像出现假轮廓。

图像灰度级变化时的参数设置
在这里插入图片描述
图像灰度级数变化的效果
在这里插入图片描述

编码

一般,采样量化以后,需要对所得数据先进行PCM编码(脉码调制)。

灰度级: 表示像素明暗程度的整数量称为灰度级。

在这里插入图片描述
上图的灰度级为256,8位量化(8bit量化)。
在这里插入图片描述

空间分辨率和灰度分辨率的关系

b = M × N × k b = M×N×k b=M×N×k,当M=N时, b = N 2 × k b = N^2×k b=N2×k,b是存储数字图像所需的比特数,M,N是图像的数值矩阵行和列,灰度级 L = 2 k L=2^k L=2k,k是整数。
在这里插入图片描述

Huang[1965]的早期研究试图通过实验来量化这两个变量的相互作用对图像质量产生的影响。实验由一组主观测试组成,采用了类似于图 2.25 所示的图像。妇女脸庞图像中包含的细节相对较少,摄像师图像中包含的细节中等,人群图像中包含了大量细节。
在这里插入图片描述

改变 N和k,生成了大小和灰度分辨率不同的这三类图像。

然后,实验要求观察者根据他们的主观质量对图像进行排序。结果以等偏爱曲线汇总于N 平面中(图 2.26显示了图2.25中各类图像的平均等偏爱曲线 )。N k 平面中的每个点表示N值和 k 值等于该点的坐标的一幅图像。等偏爱曲线上的点对应于等主观质量的图像。实验发现等偏爱曲线倾向于向右上方移动,但这三类图像的等偏爱曲线形状与图2.26中的那些曲线类似。这些结果并不令人意外因为曲线向右上方移动意味着较大的N值和k值,而这又意味着更好的图像质量

观察发现,图像中的细节增多时,等偏爱曲线趋向于会变得更加竖直。这一结果表明,细节丰富的图像可能只需要较少的灰度级。例如,图 2.26中对应于人群图像的等偏爱曲线近乎竖直,表明对于固定的N值,这类图像的感觉质量与所用灰度级数(对于图2.26所的灰度级范围)基本无关。

其他两类图像的感觉质量在增加样本数的某此区间内保持不变,但灰度级数实际上降低了。造成这一结果的最可能的原因是,k 的减小倾向于增大表观对比度,即感知到图像质量改善的一种视觉效果。

在这里插入图片描述

4.2 数字图像性质

图像分辨率

在这里插入图片描述

显示分辨率

显示分辨率: 指显示屏上能够显示出的像素数目。

例如,显示分辨率为640 x 480表示显示屏分成480行,每行显示640个像素,整个显示屏就会有307200个显像点。

打印机、扫描仪分辨率 dpi

每英寸显示的线数(display pixels/inch,dpi)。

dpi 数字越大,图像越清晰。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

像素深度

指存储每个像素所用的位数,它也是用来度量图像的分辨率。

位面数量

一幅图像的位面数量相当于组成图像的象素矩阵维数。

灰度图像一个位面。

彩色图像有三个位面一红色分量、绿色分量和蓝色分量

在这里插入图片描述

4.3 像素间基本关系

像素邻域

在一定意义下,与某一像素相邻的像素的集合。反映像素间的空间关系。
在这里插入图片描述

4邻域 N 4 ( p ) N_4(p) N4(p)

在这里插入图片描述

对角邻域 N D ( p ) N_D(p) ND(p)

p(x,y):(x-1,y-1);(x+1y-1);(x-1, y+1);(x+1, y+1)每个像素与p(x,y)距离为√2

在这里插入图片描述

8 邻域 N 8 ( p ) N_8(p) N8(p)

N 8 ( p ) = N 4 ( p ) + N D ( p ) N_8(p) = N_4(p) +N_D(p) N8(p)=N4(p)+ND(p),即3×3邻域。
在这里插入图片描述

如果P(x,y)位于图像的边界,则 N 4 ( p ) N_4(p) N4(p) N D ( p ) N_D(p) ND(p) N 8 ( p ) N_8(p) N8(p)的某些点落入图像的外边。

像素邻接(connectivity)

空间上相邻,且像素灰度值相似。

像素邻接的条件:
(1) 是否接触(邻域关系?)。
(2) 灰度值是否满足某个特定的相似准则V。例如:灰度值相等;或同在一个灰度值集合中。

4 邻接

满足4邻接关系的两个条件:
(1) 2个像素p和q在V中取值;
(2) 且q在 N 4 ( p ) N_4(p) N4(p)中。
在这里插入图片描述
在这里插入图片描述

8 邻接

满足8邻接关系的两个条件:
(1) 2个像素p和q在V中取值;
(2) 且q在 N 8 ( p ) N_8(p) N8(p)中。
在这里插入图片描述
在这里插入图片描述

m邻接(混合邻接)

在这里插入图片描述
2个像素p 和g 在V中取值,且满足下列条件之一
① q在 N 4 ( p ) N_4(p) N4(p)
② q在 N 4 ( p ) N_4(p) N4(p)中且集合 N 4 ( p ) ∩ N 4 ( q ) N_4(p) \cap N_4(q) N4(p)N4(q)$是空集
在这里插入图片描述
上图a中字符全部替换为灰度值1或0,b是m邻域,c不是m邻域。

实质:当像素间同时存在4-邻接和8-邻接时,优先采用4-邻接,屏敲两个和同一像素间存在4-邻接的像素之间的8-邻接。

连通性

反映两个像素间的空间关系。
在这里插入图片描述

连通

在这里插入图片描述

通路

在这里插入图片描述

4通路
8通路
m通路

距离度量

在这里插入图片描述

欧氏距离

在这里插入图片描述

D4距离(城市距离)

在这里插入图片描述

5 数字图像表示

动态范围:动态范围表示数字影像所包含的从“最暗”至“最亮”的范围。动态范围越大,所能表示的层次越丰富,所包含的色彩空间也越广。具体又分为两个部分,即输入动态范围(相机宽容度,数字图像的理论最大动态范围)和输出动态范围(画面影像反差,数字图像记录后实际产生的动态范围)

对比度:数字图像记录后实际产生的动态范围的最大值与最小值差值。

反差比:数字图像记录后实际产生的动态范围的最大值与最小值比值。

空间分辨率:图像中最小可辨别细节的测度。

灰度分辨率:指在灰度级中可分辨的最小变化。

数字图像入门 图像的动态范围
反差与动态范围
图像的灰度级和动态范围的概念

5.1 坐标索引与线性索引

坐标索引

在这里插入图片描述

为什么要将图像的左上角定义为原点?

将图像的左上角定义为原点。这种方便的表示基于如下事实:许多图像显示器(如电视显示器)扫描图像时都从左上角开始向右移动,每次扫描一行。更重要的事实是,矩阵的第一个元素按照惯例应在矩阵的左上角。将f(x,y)的原点选择为左上角数学上是可行的,因为数字图像实际上就是矩阵。事实上,如后所述,有时我们在公式中用矩阵的行®和列©来与x和y互换。注意,在这种表示中,正x轴向下延伸,正y轴向右延伸这完全是我们熟悉的右手笛卡儿坐标系C但为让原点出现在左上角旋转了 90°。

右手定则
右手坐标系满足右手定则,即食指指向正x轴方向,中指指向正y轴方向,拇指指向上方。如图 2.18 和图 2.19 所示,我们的图像坐标系满足右手定则。实际工作中,我们也会发现左手标系,此时其,轴和y轴与图 2.18 和图 2.19 中的互换。例如,MATLAB使用左手坐标系进行图像处理。两种坐标系都可行,但使用时要一致。

在这里插入图片描述

线性索引

在这里插入图片描述

列扫描线性索引的原理:从原点开始,先向下再向右逐列扫描图像。

线性索引基于我们以图 2.22 所示的方式扫描一幅图像时对像素的计数。这样,扫描(最左边的第一列产生线性索引0到M-1,扫描第二列产生线性索引M到2M-1,以此类推,直到为最后一列的最后一个像素赋线性索引值MN-1。这样,由a表示的线性索引就是MN个可能值中的一个:0,1,2,MN-1,如图2.22所示。注意,这里的每个像素都被赋予了唯一可识别这个像素的线性索引值。

生成列扫描线性索引的公式很简单,并且可以通过观察确定。对于任何坐标对(x,y),对应的线性索引值是
a = M y + x a=My+x a=My+x。相反,给定线性索引值a的坐标索由如下公式给出:x=a mod M 和 y=(a-x)/M 回顾可知a mod M意味着“a 除以M 的余数”。这是一种在每列的开始处声明行数重复自身的形式化方法。因此,当a=0时,0除以M的余数为0,有x=0;当a=1时,余数是1,有x=1。可以看出,在a=M-1之前,x连续等于a。当a=M时(在第二列的开始处),余数是0再次有x=0,到达下一列时x增1,此时再次重复这一模式。

5.2 数字图像类型

静态图可分为矢量图(vector)和位图(bitmap)
在这里插入图片描述

矢量图

用数学公式描述的图像,用一系列绘图指令表示图像;图像中每个形状都用一个完整的公式描述,称为一个对象。
优点:
a、文数量很小;
b、图像质量与分辨率无关;
无论图像放大或缩小多少倍,总是以显示设备允许的最大清晰度显示计算机计算与显示图像时,往往能看到画图的过程。
缺点:
a、不易制作色调丰富或色彩变化太多的图像:
b、绘出来的图像不是很逼真;
c、不易在不同的软件间交换文件

位图

通过像素点表示图像,每个像素具有颜色属性和位置属性。
优点:
(1)显示速度快;
(2)真实世界的图像可以通过扫描仪、数码相机、摄像机等设备方便的转化为点位图。
缺点:
(1)存储和传输时数据量比较大;
(2)缩放、旋转时算法复杂且容易失真。
位图类型:
线画稿(LineArt)
灰度图像(GrayScale)
索引颜色图像(Index Color)
真彩色图像 (True Color)

线画稿(LineArt)

只有黑白两种颜色。适合于由黑白两色构成而没有灰度阴影的图像。
在这里插入图片描述

灰度图像(GrayScale)

从技术上说,就是具有从黑到白的若干种灰度的单色图像若灰度图像像素的灰度级用8bit表示,则每个像素都是介于黑色和白色之间的256(28=256)种灰度中的一种。

通常所说的黑白照片,其实包含了黑白之间的所有灰度色调。

索引颜色图像(Index Color)

索引颜色通常也称为映射颜色。在这种模式下,颜色是组预先定义的、有限的颜色。
索引颜色的图像最多只能显示256种颜色(种类数256是规定好的),每一种颜色由红绿蓝三色组成且都占8bit。
索引颜色图像在图像文件里定义索引颜色。打开该文件时,构成该图像具体颜色的索引值就被读入程序里,然后根据索引值找到最终的颜色。

真彩色图像 (True Color)

自然界中几乎所有颜色都可以由红、绿、蓝(R,G,B)组合而成。

真彩色图像中,每一个像素由红、绿和蓝三个字节组成,每个字节为8bit,表示0到255之间的不同的亮度值。256X256X256,能表示约1670万种颜色。

颜色深度为每像素24位的数字图像是目前所能获取、浏览和保存的颜色信息最丰富的彩色图像,由于它所表达的颜色远远超出了人眼所能辨别的范围,故将其称为“真彩色”。
在这里插入图片描述
真彩色图并不是说一幅图包含了所有的颜色,而是说它具有显示所有颜色的能力,即最多可以包含所有的颜色。

5.3 图像文件格式

图像文件的格式,即图像文件的数据构成。一般每种图像文件均有一个文件头,在文件头之后是图像数据。

数据构成

文件头
一般包括文件类型、文件制作者、制作时间、版本号、文件大小等内容。
内容由制作该图像文件的公司决定。

图像数据
各种图像文件的制作还涉及到图像文件的压缩方式和存储效率等。

数字图像有多种存储格式,每种格式一般由不同的开发商支持。随着信息技术的发展和图像应用领域的不断拓宽,还会出现新的图像格式。

图像文件格式体系

互联网用: GIF、JPG、PNG
印刷用: TIF、JPG、TAG、PCX
国际标准:TIF、JPG
在这里插入图片描述

BMP图像文件格式

在这里插入图片描述

位图文件头 BITMAPFILEHEADER

在这里插入图片描述

位图信息头 BITMAPINFOHEADER

在这里插入图片描述

调色板Palette

在这里插入图片描述

实际的位图数据ImageDate

真彩色图像,图像数据就是实际的R、G、B值,三个字节表示1个像素。

对于用到调色板的位图,图象数据就是该象素颜在调色板中的索引值。

2色位图,用1位就可以表示该象素的颜色(一般0表示黑,1表示白),所以一个字节可以表示8个像素。

16色位图,用4位可以表示一个象素的颜色,所以一个字节可以表示2个像素。

256色位图,一个字节刚好可以表示1个像素。

下面两点需注意
(1) 每一行的字节数必须是4的整数倍,如果不是,则需要补齐。
(2) BMP文件的数据存放是从下到上,从左到右的。
从文件中最先读到的是图像最下面一行的左边第一个像素,然后是左边第二个像素,接下来是倒数第二行左边第一个像素,左边第二个像素。依次类推,最后得到的是最上面一行的最右边的一个像素。

在这里插入图片描述
R、G、B表即为调色板。

对于真彩色图像,因为大部分真彩色图像包含的颜色比较多,如果使用调色板,那么表中的颜色很多,索引量就会很大,查找就会很耗时,所以真彩色图像一般不适用调色板,直接使用3个字节标识一个像素点即可。

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/guai7guai11/article/details/128848234