yolo aumenta la pérdida de MPDIoU

La regresión de cuadro delimitador (BBR) se utiliza ampliamente en la detección de objetivos y la segmentación de instancias y es un paso importante en la localización de objetivos. Sin embargo, la mayoría de las funciones de pérdida de regresión de cuadros delimitadores existentes no se pueden optimizar cuando el cuadro predicho y el cuadro anotado real tienen la misma relación de aspecto pero valores de ancho y alto completamente diferentes. Para resolver los problemas anteriores, el autor exploró completamente las características geométricas de los rectángulos horizontales y propuso una métrica de comparación de similitud de cuadro delimitador basada en la distancia mínima del punto - MPDIoU, que incluye todos los factores relevantes considerados en las funciones de pérdida existentes, como la superposición o área no superpuesta, distancia del punto central y desviaciones de ancho y alto, al tiempo que simplifica el proceso de cálculo. Sobre esta base, el autor propone una función de pérdida de regresión del cuadro delimitador basada en MPDIoU.

Acerca de MPDIoU:

MPDIoU: Una pérdida para la regresión del cuadro delimitador eficiente y preciso: notas de estudio en papel_blog de athrunsunny-blog de CSDN

Los indicadores son los siguientes.

Reproduzca de acuerdo con la fórmula en la imagen a continuación y el diagrama esquemático. Si tiene alguna pregunta, no dude en informarnos y comunicarse entre nosotros.

Modificar la función bbox_iou en metrics.py

def bbox_iou(box1, box2, xywh=True, GIoU=False, DIoU=False, CIoU=False, MDPIoU=False, feat_h=640, feat_w=640,
              eps=1e-7):
    # Returns Intersection over Union (IoU) of box1(1,4) to box2(n,4)

    # Get the coordinates of bounding boxes
    if xywh:  # transform from xywh to xyxy
        (x1, y1, w1, h1), (x2, y2, w2, h2) = box1.chunk(4, 1), box2.chunk(4, 1)
        w1_, h1_, w2_, h2_ = w1 / 2, h1 / 2, w2 / 2, h2 / 2
        b1_x1, b1_x2, b1_y1, b1_y2 = x1 - w1_, x1 + w1_, y1 - h1_, y1 + h1_
        b2_x1, b2_x2, b2_y1, b2_y2 = x2 - w2_, x2 + w2_, y2 - h2_, y2 + h2_
    else:  # x1, y1, x2, y2 = box1
        b1_x1, b1_y1, b1_x2, b1_y2 = box1.chunk(4, 1)
        b2_x1, b2_y1, b2_x2, b2_y2 = box2.chunk(4, 1)
        w1, h1 = b1_x2 - b1_x1, b1_y2 - b1_y1
        w2, h2 = b2_x2 - b2_x1, b2_y2 - b2_y1

    # Intersection area
    inter = (torch.min(b1_x2, b2_x2) - torch.max(b1_x1, b2_x1)).clamp(0) * \
            (torch.min(b1_y2, b2_y2) - torch.max(b1_y1, b2_y1)).clamp(0)

    # Union Area
    union = w1 * h1 + w2 * h2 - inter + eps

    # IoU
    iou = inter / union
    if CIoU or DIoU or GIoU:
        cw = torch.max(b1_x2, b2_x2) - torch.min(b1_x1, b2_x1)  # convex (smallest enclosing box) width
        ch = torch.max(b1_y2, b2_y2) - torch.min(b1_y1, b2_y1)  # convex height
        if CIoU or DIoU:  # Distance or Complete IoU https://arxiv.org/abs/1911.08287v1
            c2 = cw ** 2 + ch ** 2 + eps  # convex diagonal squared
            rho2 = ((b2_x1 + b2_x2 - b1_x1 - b1_x2) ** 2 + (b2_y1 + b2_y2 - b1_y1 - b1_y2) ** 2) / 4  # center dist ** 2
            if CIoU:  # https://github.com/Zzh-tju/DIoU-SSD-pytorch/blob/master/utils/box/box_utils.py#L47
                v = (4 / math.pi ** 2) * torch.pow(torch.atan(w2 / (h2 + eps)) - torch.atan(w1 / (h1 + eps)), 2)
                with torch.no_grad():
                    alpha = v / (v - iou + (1 + eps))
                return iou - (rho2 / c2 + v * alpha)  # CIoU
            return iou - rho2 / c2  # DIoU
        c_area = cw * ch + eps  # convex area
        return iou - (c_area - union) / c_area  # GIoU https://arxiv.org/pdf/1902.09630.pdf
    elif MDPIoU:
        d1 = (b2_x1 - b1_x1) ** 2 + (b2_y1 - b1_y1) ** 2
        d2 = (b2_x2 - b1_x2) ** 2 + (b2_y2 - b1_y2) ** 2
        mpdiou_hw_pow = feat_h ** 2 + feat_w ** 2
        return iou - d1 / mpdiou_hw_pow - d2 / mpdiou_hw_pow  # MPDIoU
    return iou  # IoU

 Modifique el método de cálculo de iou en loss.py

iou = bbox_iou(pbox, tbox[i], MDPIoU=True, feat_h=tobj.size()[2], feat_w=tobj.size()[3]).squeeze()

Supongo que te gusta

Origin blog.csdn.net/athrunsunny/article/details/132796892
Recomendado
Clasificación