[pytorch、学习] - 5.2 填充和步幅

参考

5.2 填充和步幅

5.2.1 填充

填充(padding)是指在输入高和宽的两侧填充元素(通常是0元素)。图5.2里我们在原输入高和宽的两侧分别添加了值为0的元素,使得输入高和宽从3变成了5,并导致输出高和宽由2增加到4。图5.2中的阴影部分为第一个输出元素及其计算所使用的输入和核数组元素: 0 * 0 + 0 * 1 + 0 * 2 + 0 * 3 = 0.

在这里插入图片描述

下面的例子里,我们创建一个高和宽为3的二维卷积层,然后设输入高和宽的填充数分别为1。给定一个高和宽为8的输入,我们发现输出的高和宽也是8.

import torch
import torch.nn as nn

# 定义一个函数来计算卷积层。它对输入和输出做出相应的升维和降维
def comp_conv2d(conv2d, X):
    # (1, 1)代表批量大小和通道数
    X = X.view((1, 1) + X.shape)   # (8, 8) -> (1, 1, 8, 8) 
    Y = conv2d(X)
    return Y.view(Y.shape[2:]) 

# 注意这里是两侧分别填充1行或列,所以在两侧一共填充2行或列
conv2d = nn.Conv2d(in_channels=1, out_channels=1, kernel_size=3, padding = 1)

X = torch.rand(8, 8)
comp_conv2d(conv2d, X).shape

在这里插入图片描述

当卷积核的宽和高不同时,我们也可以通过设置宽和高上不同的填充数使输出和输入具有相同的高和宽。

# 使用高为5、宽为3的卷积核。在高和宽两侧的填充数分别为2和1
conv2d = nn.Conv2d(in_channels= 1, out_channels= 1, kernel_size=(5,3), padding=(2,1))
comp_conv2d(conv2d, X).shape

在这里插入图片描述

5.2.2 步幅

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1ZsnhGOs-1594090898034)(attachment:image.png)]

# 下面我们让步幅为2,使输入的宽高减半
conv2d = nn.Conv2d(1,1, kernel_size= 3, padding=1, stride =2)
comp_conv2d(conv2d, X).shape

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/piano9425/article/details/107176756
5.2