基于transformer模型的DETR竟然也可以进行对象分割

DETR模型是Facebook发布的基于Transformer模型的端对端对象检测任务模型-- DETR(detect Transformer模型)。

DETR模型首先使用CNN卷积神经网络搜集图片的核心特征点,然后把这些特征点整合起来,通过embedding方法,把特征图片转换到特征向量空间。然后根据标准Transformer模型的编码器与解码器进行注意力机制的计算,最后把计算后的数据进行图片对象的分类,并根据检测到的位置信息,提供对象box区域,方便我们画图。

上几期图文教程,我们分享了如何使用DETR模型进行对象检测以及代码实现过程,本期我们再分享一下基于transformer模型的DETR如何来进行对象分割。

! pip install git+https://github.com/cocodataset/panopticapi.git
from PIL import Image
import requests
import io
import math
import matplotlib.pyplot as plt
%config InlineBackend.figure_format = 'retina'
import torch
from torch import nn
from torchvision.

猜你喜欢

转载自blog.csdn.net/weixin_44782294/article/details/131905645
今日推荐