概述

计算机视觉，是模仿人类眼睛看到图像，得出信息的行为。

比如，用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉，并进一步做图形处理，使电脑处理成为更适合人眼观察或传送给一起检测的图像。

在这个意义上上来讲是属于图像处理的一种。

作为一个科学学科，计算机视觉研究相关的理论和技术，试图建立能够从图像或者多维数据中获取“信息”的人工智能系统。

根据得出信息的不同，可以划分为物体识别和检测（Object Detection），语义分割（Semantic Segmentation），运动和跟踪（Motion & Tracking），三维重建（3D Reconstruction），视觉问答（Visual Question & Answering），动作识别（Action Recognition）等。

解决方案

传统的计算机视觉对待问题的解决方案基本上都是遵循：图像预处理 → 提取特征 → 建立模型（分类器/回归器） → 输出的流程。

基于学习的方法最火的就是深度学习。在深度学习中，大多问题都会采用端到端（End to End）的解决思路，即从输入到输出一气呵成。

基于几何方法最火的就是视觉SLAM。视觉SLAM就是用摄像头作为主传感器，用拍摄的视频流作为输入来实现SLAM。视觉SLAM广泛应用于VR/AR、自动驾驶、智能机器人、无人机等前沿领域。

计算机视觉的难点

难以模拟的人类视觉：

人类视觉（有幻觉，独特机理尚未被模拟，旋转的静止图片）和机器视觉的工作原理不一致
空想性错试 —— 把东西看成人脸 ——emoji
人眼总希望以3D方法理解世界，下意识以透视等理解一张图。

图像处理过程——传统计算机视觉

提取原始图像
预处理【灰度---〉滤波/边缘检测/分割】
特征处理【提取特征值-->对提取的区域做处理(填充区域，膨胀，开操作等)】

上述步骤为对某一类特定图像的处理，比如人脸识别、指纹识别、车牌识别等等.

灰度：你采集图像可能是彩色的，而这样的图像色素太多，如果你的图像背景稍微一变化，你的图像就没法处理了，所以图像一般要先灰度，或便成二值图像，
滤波：灰度完之后，就要滤波，也就是把你要处理的特定图像外的背景去掉，
提取特征值：然后才是对你要研究的图像进行算法处理，提取特征值。

常见的视觉算法

图像预处理算法：

1.图像梯度算法Sobel、Scharr

2.角点检测算法Harris

3.边缘检测算法Canny

4.z直线检测算法Hough

图像特征处理算法：

1.SIFT（尺度不变特征变换）

2.SURF（加速稳健特征）

3.HOG（梯度直方图）

4.Histogram（直方图）

5.LBP（局部二值模式）

6. Brute-Force（蛮力特征匹配）

机器学习常用算法：

1.KNN（K近邻）

2.SVM（支持向量机）

3.K-means（K均值）

4.Haar级联分类器

5.RF（随机森林）

6. Decision Tree（决策树）

7.LR（逻辑回归）

8. GMM（高斯混合模型）

9.SOM（自组织映射）

10.HMM（匹配矩阵）

11.CNN（卷积神经网络）

计算机视觉——初理解

概述

解决方案

计算机视觉的难点

图像处理过程——传统计算机视觉

常见的视觉算法

猜你喜欢