计算机视觉——初理解

参考链接:

1. 计算机视觉 ----全面介绍_疯子书生的博客-CSDN博客

2. 图像处理入门教程_陈俊岭的程序员之路(公众号求关注,方便交流)-CSDN博客_图像处理

3. https://education.huaweicloud.com/courses/course-v1:HuaweiX+CBUCNXA009+Self-paced/courseware/1a06f73cc19a4290b763ad4f4c93d527/8b1516119e93411d99f3107be186a623/

4.计算机视觉常用算法整理_小马哥博客录-CSDN博客_计算机视觉常用算法

5.十大经典算法(图像处理)_Java_college的博客-CSDN博客

概述

计算机视觉,是模仿人类眼睛看到图像,得出信息的行为。

比如,用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给一起检测的图像 。

在这个意义上上来讲是属于图像处理的一种。

作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取“信息”的人工智能系统。 

根据得出信息的不同,可以划分为物体识别和检测(Object Detection),语义分割(Semantic Segmentation),运动和跟踪(Motion & Tracking),三维重建(3D Reconstruction),视觉问答(Visual Question & Answering),动作识别(Action Recognition)等。

解决方案

传统的计算机视觉对待问题的解决方案基本上都是遵循: 图像预处理 → 提取特征 → 建立模型(分类器/回归器) → 输出 的流程。

基于学习的方法最火的就是深度学习。在深度学习中,大多问题都会采用端到端(End to End)的解决思路,即从输入到输出一气呵成。

基于几何方法最火的就是视觉SLAM。视觉SLAM就是用摄像头作为主传感器,用拍摄的视频流作为输入来实现SLAM。视觉SLAM广泛应用于VR/AR、自动驾驶、智能机器人、无人机等前沿领域。

计算机视觉的难点

难以模拟的人类视觉:

  1. 人类视觉(有幻觉,独特机理尚未被模拟,旋转的静止图片)和机器视觉的工作原理不一致
  2. 空想性错试 —— 把东西看成人脸 ——emoji
  3. 人眼总希望以3D方法理解世界,下意识以透视等理解一张图。

图像处理过程——传统计算机视觉

  1. 提取原始图像
  2. 预处理【灰度---〉滤波/边缘检测/分割】
  3. 特征处理【提取特征值-->对提取的区域做处理(填充区域,膨胀,开操作等)】

上述步骤为对某一类特定图像的处理,比如人脸识别、指纹识别、车牌识别等等.

  • 灰度:你采集图像可能是彩色的,而这样的图像色素太多,如果你的图像背景稍微一变化,你的图像就没法处理了,所以图像一般要先灰度,或便成二值图像,
  • 滤波:灰度完之后,就要滤波,也就是把你要处理的特定图像外的背景去掉,
  • 提取特征值:然后才是对你要研究的图像进行算法处理,提取特征值。

常见的视觉算法

图像预处理算法:

1.图像梯度算法Sobel、Scharr

2.角点检测算法Harris

3.边缘检测算法Canny

4.z直线检测算法Hough

图像特征处理算法:

1.SIFT(尺度不变特征变换)

2.SURF(加速稳健特征)

3.HOG(梯度直方图)

4.Histogram(直方图)

5.LBP(局部二值模式)

6. Brute-Force(蛮力特征匹配)

机器学习常用算法:

1.KNN(K近邻)

2.SVM(支持向量机)

3.K-means(K均值)

4.Haar级联分类器 

5.RF(随机森林)

6. Decision Tree(决策树)

7.LR(逻辑回归)

8. GMM(高斯混合模型)

9.SOM(自组织映射)

10.HMM(匹配矩阵)

11.CNN(卷积神经网络)

猜你喜欢

转载自blog.csdn.net/lamanchas/article/details/121667292
今日推荐