Detección de objetivos YOLOv7 - estructura de red 1 - interpretación del archivo de configuración de estructura de red

modelos/yolo.py

Abra la carpeta de modelos,
la carpeta yolo.py es el componente principal principal y common.py es el componente pequeño.
Combinado con el archivo de configuración yolov7.yaml en cfg/training para ver la estructura de la red.

    def forward_once(self, x, profile=False):
        y, dt = [], []  # outputs
        for m in self.model:    # model是根据配置文件生成的,m就是走每一层
            if m.f != -1:  # if not from previous layer
                x = y[m.f] if isinstance(m.f, int) else [x if j == -1 else y[j] for j in m.f]  # from earlier layers

            if not hasattr(self, 'traced'):
                self.traced=False

            if self.traced:
                if isinstance(m, Detect) or isinstance(m, IDetect) or isinstance(m, IAuxDetect) or isinstance(m, IKeypoint):
                    break

            if profile:
                c = isinstance(m, (Detect, IDetect, IAuxDetect, IBin))
                o = thop.profile(m, inputs=(x.copy() if c else x,), verbose=False)[0] / 1E9 * 2 if thop else 0  # FLOPS
                for _ in range(10):
                    m(x.copy() if c else x)
                t = time_synchronized()
                for _ in range(10):
                    m(x.copy() if c else x)
                dt.append((time_synchronized() - t) * 100)
                print('%10.1f%10.0f%10.1fms %-40s' % (o, m.np, dt[-1], m.type))

            x = m(x)  # run,x得到的特征图
            
            y.append(x if m.i in self.save else None)  # save output

        if profile:
            print('%.1fms total' % sum(dt))
        return x

archivo de configuración yolov7.yaml

Combinado con el archivo de configuración yolov7.yaml en cfg/training para ver la estructura de la red.
El primero es el módulo para extraer características del backbone y el head es el módulo para la salida.

from se refiere a qué capa está conectada al frente, la entrada de esta capa es la salida de la primera capa, -1 significa la capa anterior y -2 significa las dos capas superiores.
número se refiere a cuántas veces se repite esta capa.
módulo ¿Qué hace este módulo.
El parámetro args es el número de mapas de características, el tamaño de la convolución y el tamaño del paso de zancada.
p es casi equivalente a una fracción del mapa de características original en el proceso de reducción de resolución.
Y tenga en cuenta el número de capas.
inserte la descripción de la imagen aquí
inserte la descripción de la imagen aquí
La primera columna 75, 88, 101 se refiere a los pisos 75, 88 y 101.

capa de costura concat
inserte la descripción de la imagen aquí

inserte la descripción de la imagen aquí

Supongo que te gusta

Origin blog.csdn.net/ThreeS_tones/article/details/129811155
Recomendado
Clasificación