机器视觉日常习题

第二讲 图像处理概述

图像处理概述

  1. 几何变换:又称为图像空间变换,它将一幅图像中的坐标位置映射到另一幅图像中的新坐标位置。
  2. 图像分割:把图像分成各具特色的区域并提取感兴趣目标的技术和过程。
  3. 图像边缘:在这里插入图片描述

填空

  1. 平滑,增强,复原
  2. 一般包括:图像增强、图像复原、图像编码、图像分割、图像重建等内容。
  3. 一般包含两部分内容:
    空间运算,实现输入图像与输出图像的位置映射
    灰度插值,用于计算新位置上像素的灰度值
  4. 点操作和模板操作
  5. 平滑滤波锐化滤波
  6. 保留低频分量而除去高频分量
  7. 平滑
  8. 锐化
  9. 数值相似性:如灰度差、区域灰度分布
    空间接近性:如欧氏距离、区域致密度
  10. 一种是基于区域的方法
    另一种是使用边缘检测的轮廓预估方法

填空2

  1. 一般常用一阶或二阶导数来检测边缘
  2. 阶梯状
    脉冲状
    屋顶状
  3. 一阶微分边缘检测算子
  4. 单阈值分割
    多阈值分割
  5. 边缘是灰度不连续的结果,是图像局部强度变化最显著的部分。这种不连续常可利用求导数方便地检测到
  6. 灰度阈值分割法
  7. 区域生长
    合并与分裂
  8. 加性噪声乘性噪声

简答

  1. 图像预处理的主要目的是消除图像中无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。

  2. 一般包括:数字化、几何变换、归一化、平滑、增强、复原等内容。

  3. 目的是对图像进行相关的一些运算,以便简化后续的图像分析(图像描述、图像识别)工作

  4. 一般包括:图像增强、图像复原、图像编码、图像分割、图像重建等内容

  5. 便于在计算机中保存图像
    便于计算对图像进行处理

  6. 线性平滑滤波器+非线性平滑滤波器空域滤波器

  7. 将图像从图像空间转换到频域空间(傅立叶变换)
    在频域空间对图像进行增强;
    将增强后的图像再从频域空间转换到图像空间(傅立叶逆变换)。

  8. 低通滤波、高通滤波、带通滤波、带阻滤波

  9. 噪声:内部噪声、外部噪声;高斯噪声、椒盐噪声
    运动:图像拖影问题。

  10. 数值相似性:如灰度差、区域灰度分布
    空间接近性:如欧氏距离、区域致密度

简答2

  1. 边缘是灰度不连续的结果,是图像局部强度变化最显著的部分。这种不连续常可利用求导数方便地检测到,一般常用一阶或二阶导数来检测边缘
  2. 由直方图灰度分布选择阈值,对与灰度图像,利用图像灰度统计信息的方法显示灰度分布,而分割的阈值选择在不同的山谷,一般采用一维直方图阈值化方法。从直方图中选取合适的阈值进行图像分割即可。
  3. 图像分割就是把图像分成各具特色的区域并提取感兴趣目标的技术和过程。
  4. 基于边界的分割技术:一阶微分算子,二阶微分算子
    基于区域的分割技术:并行区域技术,串行区域技术

单项选择

  1. B. 中值滤波,对椒盐噪声滤除效果极好
  2. B
  3. A
    平滑滤波:可以减弱或消除图像中的高频分量,但不影响低频分量,主要用于消除噪声
    低通滤波
    原理:保留低频分量而除去高频分量。
    结果:可以除去或消除噪声,但同时也模糊了边缘轮廓。
  4. B
    高通滤波
    原理:保留高频分量而除去低频分量。
    结果:除去图像的大部分信息,只保留边缘轮廓。
    锐化滤波:可以减弱或消除图像中的低频分量,但不影响高频分量,主要用于增强被模糊的细节或目标的边缘。
  5. A
    wu
  6. B 取阈值是最常见的并行区域分割算法

单项2

  1. A
  2. B (不确定)
  3. B
    滤波是典型的模版操作
    利用像素本身及其邻域像素的灰度关系进行增强
  4. A
    图像频谱给出的是图像全局的性质,所以频域增强不是对逐个像素进行的。

计算题

  1. (待写,之前写错了,真不好意思)

不考

计算2

  1. 用卷积,这个就不多说了(下列结果没有进行验算,主要学习计算方法)

这个矩阵比较特殊,它很对称,我们也可以对应位置相加,最后乘1/4.
在题目中不考虑边缘,所以我们会得到3*3的边缘矩阵,最后把边缘补充上就好了
结果:
结果
对于边缘有两种方法,第一种是对边缘填0,第二种是边缘映射,将边缘
映射到边缘

手写:

土拍

第四章

名词解释

  1. 图像目标的特征是对图像目标特性的抽象,是用于区别不同种类的目标的概念描述。
  2. 纹理是图像中反复出现的局部模式和它们的排列规则
  3. 特征选择是指从一组原始特征中挑选出最有效的特征子集,以达到降低特征空间维数、简化分类器设计、提高分类速度的目的。

填空

  1. 手工设计特征(Hand Crafted, 传统的方法)
    特征学习(Feature Learning, 深度学习的方法)
  2. 视觉特征统计特征、代数特征、变换系数特征、其他物理特征
  3. 视觉特征指人类视觉对目标的感觉特征,其主要包括:颜色、边缘、轮廓、纹理、形状,等等
  4. 色彩感觉不仅与物体本来的颜色特性有关,还受时间、空间、外表状态以及该物体周围环境的影响,同时还受人的主观因素的影响。
  5. 自然界的颜色分为彩色非彩色两大类
  6. RGB是一种相加模型,主要用于显示设备。
  7. CMY是一种相减模型,主要用于印刷行业。即:混合的油墨能反射和吸收什么光。
  8. 纹理反映了图像中像素亮度变化的一种趋势

简答

  1. 视觉特征、统计特征、代数特征、变换系数特征、其他物理特征

  2. 视觉特征指人类视觉对目标的感觉特征,其主要包括:颜色、边缘、轮廓、纹理、形状,等等

  3. 色是光作用于人眼引起的除形象以外的视觉特性,是人的一种心理反映。色彩感觉不仅与物体本来的颜色特性有关,还受时间、空间、外表状态以及该物体周围环境的影响,同时还受人的主观因素的影响。

  4. RGB颜色模型 、CMY颜色模型 、HSV / HSI颜色模型 、YUV / YCbCr颜色模型 、CIE-Lab / Lab*颜色模型
    RGB是一种相加模型,主要用于显示设备。
    CMY是一种相减模型,主要用于印刷行业。即:混合的油墨能反射和吸收什么光

  5. 形状因子、外观比、扩展比例、充实度、偏心率、球状性、欧拉数

  6. 1、纹理的尺度性:同一物体,在不同尺度上,其纹理特征不同
    2、纹理的粗糙度:不同物质,其纹理粗糙度可能不同
    3、纹理的规则性:有规则,无规则
    4、纹理的区域性:不同区域,其纹理可能不同

  7. 主要分为两大类
    基于灰度直方图的纹理特征,包括:平均亮度、平均对比度、平滑度、三阶矩、一致性、熵等。
    基于灰度共生矩阵的纹理特征,包括:能量、对比度、均匀性、相关性、熵等。

  8. 可设置两个终止条件:
    1)已达到指定的最大进化代数MaxGen,或
    2)最优特征子集连续Gen代都没有发生变化。
    MaxGen和Gen为经验常数。

单项选择

  1. A
  2. B
  3. C
  4. B
  5. B
  6. A 灰度共生矩阵就是一种通过研究灰度的空间相关特性来描述纹理的常用方法
  7. D 特征选择是指从一组原始特征中挑选出最有效的特征子集,以达到降低特征空间维数、简化分类器设计、提高分类速度的目的。
  8. B 遗传算法适合对较大特征空间进行搜索,而且不要求评价函数具有单调性,因此在特征选择、参数寻优、系统控制等多个领域都有成功应用。

计算题

计算题:

  1. 这是8级灰度图,所以我们先画一个88的图,这里我就用xlsx表示了
    表示
    随后在这个8
    8的矩阵上对(前一个数,后一个数)坐标上加一。
    如(0,7),(7,5),(3,1)等
    这里
    最终:
    图
    其他位置进行填0

综合题:

第五章 不变特征(待写。。。)

名词解释+填空
名词解释

  1. 全局不变特征是将整幅图像看成一个整体,无差别地对待整幅图像中的每个像素数据,不管这个数据是表示目标的还是背景的。
  2. 图像局部特征是由一些亮度变化很大的像素点组成的局部结构,这些局部结构包含有丰富的图像信息,具有较强的代表性。

填空

  1. 按照几何不变性的自由度可以分为
    平移不变特征、旋转不变特征、仿射不变特征、尺度不变特征和投影不变特征
  2. 按照特征层次的不同可以分为:点不变特征和区域不变特征;
  3. 按照特征提取时区域大小又可分为:全局不变特征、局部不变特征、全局和局部相结合的不变特征。
  4. 全局不变特征是将整幅图像看成一个整体,无差别地对待整幅图像中的每个像素数据,不管这个数据是表示目标的还是背景的。
  5. 原点矩
  6. nan

简答
三、 简答题

  1. 在图像获取过程中,总是存在尺度缩放、旋转、平移、噪声干扰、观察视点变化及光照变化等因素,这些因素影响了系统的鲁棒性。因而,在进行目标识别或跟踪时,必须从图像中提取对上述变化具有一定不变性的特征,再进行特征匹配。
  2. 在图像获取过程中,总是存在尺度缩放、旋转、平移、噪声干扰、观察视点变化及光照变化等因素,这些因素影响了系统的鲁棒性。
  3. 按照几何不变性的自由度可以分为平移不变特征、旋转不变特征、仿射不变特征、尺度不变特征和投影不变特征;
  4. 如下
    tu

单项选择
四、 单项选择

  1. D
  2. A
  3. B

计算题

  1. 质心坐标公式:
    m ( p q ) = ∑ x = 1 C ∑ y = 1 R x p y q f ( x , y ) p , q = 0 , 1 , 2... x 0 = m 10 m 00 y 0 = m 01 m 00 m_(pq)=\sum^C_{x=1}\sum^R_{y=1}x^py^qf(x,y)\\ p,q=0,1,2...\\ x_0=\frac{m_{10}}{m_{00}}y_0=\frac{m_{01}}{m_{00}} m(pq)=x=1Cy=1Rxpyqf(x,y)p,q=0,1,2...x0=m00m10y0=m00m01

填空
一、填空

  1. 物体分类主要研究what这个问题
  2. 物体检测主要研究where这个问题
  3. 如下:
    0
  4. 小 大
  5. 基于兴趣点检测和密集提取方式
  6. 一般可通过聚类实现,或使用空间特征汇聚

简答
二、简答

  1. 如下

安防领域的人脸识别、行人检测、智能视频分析、行人跟踪等
交通领域的交通场景物体识别(汽车避障等)、车辆计数、逆行检测、车牌检测与识别
互联网领域的基于内容的图像检索、相册自动归类

  1. 如下
  1. 实例层次
    针对单个物体实例而言,通常由于图像采集过程中光照条件、拍摄视角、距离的不同、物体自身的非刚体形变以及其他物体的部分遮挡,使得物体实例的表观特征产生很大的变化,给视觉识别算法带来了极大的困难。
  2. 类别层次
    首先是类内差大,即属于同一类的物体表观特征差别比较大,强调的是类内不同实例的差别,例如同样是椅子,外观却是千差万别
    其次是类间模糊性,即不同类的物体实例具有一定的相似性,如狼和哈士奇,从外观上很难分开二者
    再次是背景的干扰,在实际场景下,物体不可能出现在一个非常干净的背景下,往往相反,背景可能是非常复杂的、对我们感兴趣的物体存在干扰的,这使得识别问题的难度大大增加。
  3. 语义层次
    困难和挑战与图像的视觉语义相关,一个典型的问题称为多重稳定性
  1. 如下

简单到复杂,特殊到一般,小规模到大规
开始重点研究的是特定问题中的图像分类
然后重点研究的是一般目标的分类与检测
现在重点研究的是更大规模的分类与检测

  1. 如下
    词包
  2. 如下

深度信念网络DBN
DBN是一种层次化的无向图模型.
DBN的基本单元就是 RBM(受限波尔兹曼机)
首先先以原始输入为可视层,训练一个单层的RBM,然后固定第一层RBM权重,以RBM隐藏层单元的响应作为新的可视层,训练下一层的RBM,以此类推.
通过这种贪婪式的无监督训练,可以使整个DBN模型得到一个比较好的初始值,然后可以加入标签信息,通过产生式或者判别式方式,对整个网络进行有监督的精调,进一步改善网络性能.
DBN的多层结构,使得它能够学习得到层次化的特征表达,实现自动特征抽取。

  1. 如下

目标定位
任务是负责确定输入图像中是否存在指定类别的物体;如果存在,给出物体所处的位置和范围,通常使用方形包围盒Bounding Box。
目标分类
任务是负责判断所选图像区域(Proposals)中是否有感兴趣类别的物体出现,输出的带分数的标签表明感兴趣类别的物体出现在所选择区域中的可能性。

  1. 如下

传统检测算法的主要组成部分

  1. 检测窗口的选择
    滑动窗口法(暴力搜索)
    Selective Search区域提取法
  2. 特征的设计
    Haar、HOG、LBP
  3. 分类器的设计
    AdaBoost(SVM)、SVM、决策树
  1. 如下

基于深度学习的目标检测算法的大致组成

  1. 特征学习部分
    主要通过若干个卷积、池化、激活层的堆叠实现特征学习
    也会嵌入注意力模块,提高学习效果
  2. 分类部分
    可通过SoftMax分类器实现目标分类
  3. 后处理部分(可选)
    非极大值抑制

单项
三、单项选择

  1. A
  2. D

计算题
四、计算

  1. 就是卷积运算,这个不考虑边缘,直接算,最后将原图像的边缘数值补上
    综合题
    五、综合题

猜你喜欢

转载自blog.csdn.net/weixin_51395608/article/details/131043204