Pytorch implementa la estructura de red ResNet50, que incluye ResNet18, ResNet34, ResNet50, ResNet101, ResNet152

Cree varias versiones de los modelos ResNet, ResNet18, ResNet34, ResNet50, ResNet101, ResNet152

Dirección original: https://arxiv.org/pdf/1512.03385.pdf


La tesis no será interpretada. La mayor parte de la interpretación es traducción. Parece entender pero no entender, simplemente entenderlo por ti mismo.

Recientemente, estaba pensando en implementar la estructura de red clásica, después de leer el texto original, comencé a darme cuenta de ello basándome en la estructura del código original.

Al principio busqué la implementación de varias versiones y encontré que muchos blogs estaban llenos de errores. Algunas publicaciones de blogs se han publicado durante algunos años, pero nadie encontró el error. Decenas de personas en el área de comentarios no saben si realmente entienden o fingen entender. Indefenso.

Por lo tanto, planeo implementar la estructura de la red manualmente, ejercitar mi capacidad de código y profundizar la comprensión de la estructura de la red.

Después de terminar de escribir, me quedé muy contento. Después de todo, siempre he pensado que soy un novato. Recientemente, he encontrado muchos errores en la publicación del blog uno tras otro, y mucha gente no lo ha encontrado después de leerlo. Pensando en ello, parece que tengo un poco de nivel.

Finalmente, en un conjunto de códigos, se implementan varias versiones de ResNet por conveniencia.

De hecho, al final, es mejor escribir cada red por separado. Debido a que las operaciones internas de las diferentes versiones de la red son muy diferentes, el siguiente código en este artículo está escrito por separado para ResidualBlock y BottleNeckBlock, pero la diferencia en la transformación de dimensionalidad sigue siendo muy complicada. Por un lado, quiero mejorar la reutilización del código. Los aspectos también están sujetos a complejidad. Por lo tanto, el código final escrito no es un código simplificado con alta reutilización. Apenas funciona. En cuanto a la estructura de ResNet, además de escribir por separado para cada versión, los bloques repetidos se pueden escribir por separado, porque la transformación dimensional de BottleNeckBlock es demasiado complicada y hay muchas transformaciones de parámetros, por lo que se pueden separar si se pueden separar, y se pueden reutilizar lugares con baja complejidad.


La siguiente es la estructura de la red y el código de implementación, todos son correctos después de la inspección; el nivel es limitado, si se encuentran errores, comente y avísenos.

1 Diagrama de estructura residual

2 Comparación de estructura entre VGG-19 y ResNet34

Inserte la descripción de la imagen aquí

3 La estructura de cada versión de ResNet

[Error en la transferencia de la imagen del enlace externo. El sitio de origen puede tener un mecanismo anti-hotlinking. Se recomienda guardar la imagen y cargarla directamente (img-qLEx5XJg-1602504703995) (C: \ Users \ tony \ AppData \ Roaming \ Typora \ typora-user-images \ image-20201012200856046.png)]

4 Código para implementar cada versión

import torch.nn as nn
from torch.nn import functional as F

class ResNetModel(nn.Module):
    """
    实现通用的ResNet模块,可根据需要定义
    """
    def __init__(self, num_classes=1000, layer_num=[],bottleneck = False):
        super(ResNetModel, self).__init__()

        #conv1
        self.pre = nn.Sequential(
            #in 224*224*3
            nn.Conv2d(3,64,7,2,3,bias=False),   #输入通道3,输出通道64,卷积核7*7*64,步长2,根据以上计算出padding=3
            #out 112*112*64
            nn.BatchNorm2d(64),     #输入通道C = 64

            nn.ReLU(inplace=True),   #inplace=True, 进行覆盖操作
            # out 112*112*64
            nn.MaxPool2d(3,2,1),    #池化核3*3,步长2,计算得出padding=1;
            # out 56*56*64
        )

        if bottleneck:  #resnet50以上使用BottleNeckBlock
            self.residualBlocks1 = self.add_layers(64, 256, layer_num[0], 64, bottleneck=bottleneck)
            self.residualBlocks2 = self.add_layers(128, 512, layer_num[1], 256, 2,bottleneck)
            self.residualBlocks3 = self.add_layers(256, 1024, layer_num[2], 512, 2,bottleneck)
            self.residualBlocks4 = self.add_layers(512, 2048, layer_num[3], 1024, 2,bottleneck)

            self.fc = nn.Linear(2048, num_classes)
        else:   #resnet34使用普通ResidualBlock
            self.residualBlocks1 = self.add_layers(64,64,layer_num[0])
            self.residualBlocks2 = self.add_layers(64,128,layer_num[1])
            self.residualBlocks3 = self.add_layers(128,256,layer_num[2])
            self.residualBlocks4 = self.add_layers(256,512,layer_num[3])
            self.fc = nn.Linear(512, num_classes)

    def add_layers(self, inchannel, outchannel, nums, pre_channel=64, stride=1, bottleneck=False):
        layers = []
        if bottleneck is False:

            #添加大模块首层, 首层需要判断inchannel == outchannel ?
            #跨维度需要stride=2,shortcut也需要1*1卷积扩维

            layers.append(ResidualBlock(inchannel,outchannel))

            #添加剩余nums-1层
            for i in range(1,nums):
                layers.append(ResidualBlock(outchannel,outchannel))
            return nn.Sequential(*layers)
        else:   #resnet50使用bottleneck
            #传递每个block的shortcut,shortcut可以根据是否传递pre_channel进行推断

            #添加首层,首层需要传递上一批blocks的channel
            layers.append(BottleNeckBlock(inchannel,outchannel,pre_channel,stride))
            for i in range(1,nums): #添加n-1个剩余blocks,正常通道转换,不传递pre_channel
                layers.append(BottleNeckBlock(inchannel,outchannel))
            return nn.Sequential(*layers)

    def forward(self, x):
        x = self.pre(x)
        x = self.residualBlocks1(x)
        x = self.residualBlocks2(x)
        x = self.residualBlocks3(x)
        x = self.residualBlocks4(x)

        x = F.avg_pool2d(x, 7)
        x = x.view(x.size(0), -1)
        return self.fc(x)


class ResidualBlock(nn.Module):
    '''
    定义普通残差模块
    resnet34为普通残差块,resnet50为瓶颈结构
    '''
    def __init__(self, inchannel, outchannel, stride=1, padding=1, shortcut=None):
        super(ResidualBlock, self).__init__()
        #resblock的首层,首层如果跨维度,卷积stride=2,shortcut需要1*1卷积扩维
        if inchannel != outchannel:
            stride= 2
            shortcut=nn.Sequential(
                nn.Conv2d(inchannel,outchannel,1,stride,bias=False),
                nn.BatchNorm2d(outchannel)
            )

        # 定义残差块的左部分
        self.left = nn.Sequential(
            nn.Conv2d(inchannel, outchannel, 3, stride, padding, bias=False),
            nn.BatchNorm2d(outchannel),
            nn.ReLU(inplace=True),

            nn.Conv2d(outchannel, outchannel, 3, 1, padding, bias=False),
            nn.BatchNorm2d(outchannel),

        )

        #定义右部分
        self.right = shortcut

    def forward(self, x):
        out = self.left(x)
        residual = x if self.right is None else self.right(x)
        out = out + residual
        return F.relu(out)

class BottleNeckBlock(nn.Module):
    '''
    定义resnet50的瓶颈结构
    '''
    def __init__(self,inchannel,outchannel, pre_channel=None, stride=1,shortcut=None):
        super(BottleNeckBlock, self).__init__()
        #首个bottleneck需要承接上一批blocks的输出channel
        if pre_channel is None:     #为空则表示不是首个bottleneck,
            pre_channel = outchannel    #正常通道转换


        else:   # 传递了pre_channel,表示为首个block,需要shortcut
            shortcut = nn.Sequential(
                nn.Conv2d(pre_channel,outchannel,1,stride,0,bias=False),
                nn.BatchNorm2d(outchannel)
            )

        self.left = nn.Sequential(
            #1*1,inchannel
            nn.Conv2d(pre_channel, inchannel, 1, stride, 0, bias=False),
            nn.BatchNorm2d(inchannel),
            nn.ReLU(inplace=True),
            #3*3,inchannel
            nn.Conv2d(inchannel,inchannel,3,1,1,bias=False),
            nn.BatchNorm2d(inchannel),
            nn.ReLU(inplace=True),
            #1*1,outchannel
            nn.Conv2d(inchannel,outchannel,1,1,0,bias=False),
            nn.BatchNorm2d(outchannel),
            nn.ReLU(inplace=True),
        )
        self.right = shortcut

    def forward(self,x):
        out = self.left(x)
        residual = x if self.right is None else self.right(x)
        return F.relu(out+residual)


if __name__ == '__main__':
    # channel_nums = [64,128,256,512,1024,2048]

    num_classes = 6

    #layers = 18, 34, 50, 101, 152
    layer_nums = [[2,2,2,2],[3,4,6,3],[3,4,6,3],[3,4,23,3],[3,8,36,3]]
    #选择resnet版本,
    # resnet18 ——0;resnet34——1,resnet-50——2,resnet-101——3,resnet-152——4
    i = 3;
    bottleneck = i >= 2   #i<2, false,使用普通的ResidualBlock; i>=2,true,使用BottleNeckBlock

    model = ResNetModel(num_classes,layer_nums[i],bottleneck)
    print(model)

Supongo que te gusta

Origin blog.csdn.net/weixin_44277280/article/details/109035746
Recomendado
Clasificación