计算机视觉研究发展

Marr视觉计算理论:

目的:通过视觉系统,重建三维物体的形状和位置

初始省略(2维):过零点(zero-crossing)短线段、端点等基元特征

2\tfrac{1}{2}维:对物体形状的一些粗略描述

3维:对物体的三维描述

计算机视觉的早期图像表示模型是Part-based,这样就可以通过Part这种组合式的方法表示物体。但很多自然场景的物体没有这么强的结构。

80年代,特征检测和机器学习同时也开始组合应用,但对物体结构有严格限制(指定对象类型)

2000-2012年,局部特征描述得到迅速发展,如SIFT/HOG

特征描述具有通用性,结合SVM等机器学习方法。但效果有限。

从2012后,深度学习方法兴起。特征->自动提取;层数->很深。

e.g. MS的ResNet 152层(2015,ImageNet)

猜你喜欢

转载自blog.csdn.net/qq_40008456/article/details/89556383