深度学习在图像领域的几大任务

深度学习对于图像的检测共分为4大任务:

从任务需求本身的角度来考虑,由于四个任务的处理结果的信息量依次增加,需要的工具的复杂度会依次增加,因此完成相应任务的难度也会越依次增加。

(1)图像分类a--->(2)目标检测b--->(3)语义分割c--->(4)实例分割d(是按照难度递增的方式)

这张图完美地解释了四个的区别。

(1)图像分类:(Image Classification )

The task of object classification requires binary labels indicating whether objects are present in an image。

图像分类该任务需要我们对出现在某幅图像中的物体做标注。(例如输入一个测试图片,输出该图片中的物体类别)

(2)目标检测:(或者Object detection )

Detecting an object entails both stating that an object belonging to a specified class is present, and localizing it in the image. The location of an object is typically represented by a bounding box. 

物体检测,实现了两个任务:一是判断属于某个特定类的物体是否出现在图中;二是对该物体定位,定位常用表征就是物体的边界框。可实现:输入测试图片,输出检测到的物体类别和位置。

(3)语义分割:(或者Semantic scene labeling )

The task of labeling semantic objects in a scene requires that each pixel of an image be labeled as belonging to a category, such as sky, chair, floor, street, etc. In contrast to the detection task, individual instances of objects do not need to be segmented。

语义标注/分割:该任务需要将图中每一点像素标注为某个物体类别。同一物体的不同实例不需要单独分割出来。对下图,标注为人,羊,狗,草地。而不需要羊1,羊2,羊3,羊4,羊5。

(4)实例分割(Instance segment  )

实例分割是物体检测+语义分割的综合体。相对物体检测的边界框,实例分割可精确到物体的边缘;相对语义分割,实例分割可以标注出图上同一物体的不同个体(羊1,羊2,羊3...)

-----------end-------

猜你喜欢

转载自blog.csdn.net/m0_37957160/article/details/108844352