计算机视觉概述

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/water_93/article/details/82185652

        计算机视觉旨在识别和理解图像/视频中的内容。人类可以轻松的识别物体,而计算机看到的图像是一组0-255之间的整数,并且由于拍摄视角的变化、光照变化、背景、物体的形变、遮挡等,进一步增加了计算机视觉任务的难度。

计算机视觉的顶级会议有:CVPR、ICCV、ECCV、ICLR,顶级期刊有IJCV和TPAML。

计算机视觉包含四大基本任务:分类、检测、语义分割和实例分割。

1) 图像分类:判断该图像所属类别,对单个对象进行分类。

2) 目标检测:确定目标的位置并用包围盒bounding box的方式标记出来,其中目标的数量是不确定的。

3) 语义分割:确定每个像素属于哪个类别,不区分属于相同类别的不同实例。

4) 实例分割:区分属于相同类别的不同实例。

猜你喜欢

转载自blog.csdn.net/water_93/article/details/82185652