第一章-数字图像基础

前置

网上搜的信息,人眼的分辨率大约相当于5.76亿像素,眼睛中心视觉相当于700万像素,画面经过眼睛传到大脑里面形成一副完整的画面。数字图像则是计算机中由一个又一个的点组成,而这些点被称为像素。

黑白图像的表示

图像由0和1组成,黑色为0,白色为1,通过黑白色差造成视觉差异从而产生不同的画面信息,这样的图成为二值图。

通常情况下,使用一个字节(8位)来表示一个像素,根据取值范围00000000~11111111,也就是[0,255],这样就可以用8位表示256种颜色,即纯黑+254种不同黑白比例的灰+纯白,使用黑白灰等256种灰度级的图像成为灰度图。

字节是存储的基本单位,为了处理的方便和一致性,二值图只包含0和255,而灰度图的数值范围为0到255的集合。

在处理图像的过程中,像素点的像素值的处理结果可能超过255,所以会存在2种不同的处理方式:

  1. 取模处理,处理数值和256取模处理
  2. 饱和处理,处理结果超过255即取255,不超过则为数值本身

上面不同处理方式具体体现在后续numpy和opencv对像素值超过255时的处理方式不同。

数字图像在计算机中是存储在一个矩阵(数组)中的,每个元素都有各自的位置值,用来表示行号和列号。在opencv中,图像坐标原点在左上角,原点向右为x轴正方向,原点向下为y轴正方向。

图像处理中用到的图像的行row和高度height是一个意思,图像的列column和宽度是一个意思。

彩色图像的表示

图像不仅仅只有黑白灰色,还有各种绚丽的彩色。

光学三原色(红-绿-蓝)。光学三原色经过不同的比例混合后组成显示屏所能显示的各种颜色,因此这种方法也成为RGB色彩空间。

R,G,B分别对应三种颜色分量的大小,每个分量值为[0,255],因此RGB共可以显示出256*256*256=16777216种不同的颜色,远远超过肉眼所能感知的范围。

扫描二维码关注公众号,回复: 15964377 查看本文章

通常情况下,计算机在存储或计算RGB模式的像素点时,是单独存放每个色彩分量的值,即RGB色彩空间存在R通道,G通道和B通道。

大抵就是一个512*512的彩色图片是由3张512*512的分别存放R分量,G分量,B分量的薄纸组成,三张薄纸按特定顺序(RGB)叠在一起可以形成彩色的图像,这三张薄纸分别叫R通道,G通道,B通道。

其他一些概念

  1. 量化:将图片转化为计算机能理解和处理的数值成为量化,所以所有RGB通道并且每个通道有特定的颜色值。
  2. 特征:做人脸识别时,需要先把人脸位置找出来,人脸范围是特征,在做人脸甄别时,需要把人脸中的关键特征提取出来进行比对。
  3. 距离:使用距离来衡量图像之间的差异,方便区分和识别。

曼哈顿距离:各点位特征的差的绝对值之和 |x1-x2| + |y1-y2|

欧氏距离:各点位特征的差的平方和,再开根号 √ (|x1-x2|²+|y1-y2|²)

图像识别

人脸识别图示:

以图搜图图示:

数字识别图示:

图像识别的一般过程:

信息隐藏

根据一定算法实现数字信息的隐藏。

智能图像处理基础

选取合适的特征:高度概括图像特点,体现不同图像间的差异

合适的量化方式:将特征量化为合理的数值

距离计算:选用合适的距离计算方式计算距离

传统方式

自己提取特征,自己对特征进行处理

机器学习方式

自己提取特征,自动对特征进行处理

深度学习方式

自动提取高层次特征,自动对特征进行处理

猜你喜欢

转载自blog.csdn.net/sunguanyong/article/details/129134089