F.pad() 填充函数详解

目录

1、一维度填充

2、二维度填充

3、三维度填充

小结


F.pad() 是pytorch 内置的 tensor 扩充函数,便于对数据集图像或中间层特征进行维度扩充,官方定义如下:

torch.nn.functional.pad (input, pad, mode=‘constant’, value=0)
  • input:需要扩充的 tensor,可以是图像数据,亦或是特征矩阵数据;
  • pad:扩充维度,预先定义某维度上的扩充参数;
  • mode:扩充方法,有三种模式,分别表示常量(constant),反射(reflect),复制(replicate);
  • value:扩充时指定补充值,value只在mode=constant有效,即使用value填充在扩充出的新维度位置,而在reflect和replicate模式下,value不可赋值;

1、一维度填充

参数pad只定义两个参数,表示只对输入矩阵的最后一个维度进行扩充

import torch
import torch.nn.functional as F

t4d = torch.empty(1, 3,5 ,3)
print(t4d.size())  # torch.Size([1, 3, 5, 3])

p1d = (1, 2)  # (左边填充数, 右边填充数)
t1 = F.pad(t4d, p1d, 'constant', 1)
print(t1.size())  # torch.Size([1, 3, 5, 6])

2、二维度填充

参数pad定义了四个参数,表示对输入矩阵的后两个维度进行扩充

import torch
import torch.nn.functional as F

t4d = torch.empty(1, 3,5 ,3)
print(t4d.size())  # torch.Size([1, 3, 5, 3])

p2d = (1, 2, 3, 4)  # (左边填充数, 右边填充数, 上边填充数, 下边填充数)
t2 = F.pad(t4d, p2d, 'constant', 2)
print(t2.size())  # torch.Size([1, 3, 12, 6])

3、三维度填充

参数pad定义了六个参数,表示对输入矩阵的后三个维度进行扩充

import torch
import torch.nn.functional as F

t4d = torch.empty(1, 3,5 ,3)
print(t4d.size())  # torch.Size([1, 3, 5, 3])

p3d = (1, 2, 3, 4, 5, 6)
t3 = F.pad(t4d, p3d, 'constant', 3)
print(t3.size())  # torch.Size([1, 14, 12, 6])

小结

简单用一个图来表述F.pad()的应用。

参考:CSDN博客

猜你喜欢

转载自blog.csdn.net/qq_45100200/article/details/131146746
今日推荐