Pytorch中RandomResizedCrop()的参数及用法

最近在看一些代码时,发现以前学习的函数有些遗忘了,在此复习一下,也希望能给大家带来一点有用的知识。

这个RandomResizedCrop()函数跟ToTensor()这类函数一样,在torchvision中的transforms

包里面。一般来说,用于图片的preprocess和data augmentation。

import torchvision

trans = torchvision.transforms.RandomResizedCrop((224,224),scale=(0.8,1.0),ratio=(1.0,1.0))

RandomResizeCrop()这个函数,最常用的三个参数是size,scale,和ratio

首先size,是你的图片经过这个函数最后得到的图片的大小;如果这个参数你只填了一个int,那么最后图片的大小就是(int,int),如果你填的是(int,int)一个元组,那么经过该函数的图片的宽高就是(int,int)

再来说scale,如果这个参数你写的是“scale=(0.8, 1.0)”,这意味着这个函数在随机采样这个图片的时候,最少要覆盖这个图片的80%,最多保持图片不变。

接着说ratio,如果这个参数你填的是“ratio=(0.5, 1.0)”,这意味着,随机采样得到的图片,宽高的比例是0.5:1。

总得来说,这个函数会首先根据你设置的scale和ratio对图片进行随机采样,再根据你设置的size对图片进行重构,然后输出。

猜你喜欢

转载自blog.csdn.net/qq_43438974/article/details/127598815