【Atlas200】使用Mindx v2接口(C++)完成letterbox,等长宽比缩放后padding操作

letterbox介绍

在深度学习中,图像的尺寸对于模型的训练和推理十分重要。为了保持输入图像的纵横比例,避免因缩放导致的失真,通常会对图像进行裁剪或嵌入(padding)操作。其中,letterbox是一种常用的嵌入操作,其主要思想是在图像周围添加黑色边框,使图像的尺寸与模型的期望输入尺寸一致。通过这种方式,输入图像可以被缩放到模型的期望输入大小,而不会破坏图像的纵横比例。因此,letterbox可以有效地提高模型的训练和推理性能,同时保持图像的视觉质量。在训练阶段,letterbox还可以避免因图像尺寸不一致导致的batch样本大小不一致问题。在实际应用中,letterbox通常被用于目标检测、人脸识别等深度学习任务中。

使用python完成letterbox

这段代码是对输入图片进行预处理,具体步骤如下:

1.根据输入图片的通道数,创建一个与模型输入大小相同的空白图片padding_image。

2.计算原图与模型输入大小之间的缩放比例ratio,并将原图按照该比例进行缩放

猜你喜欢

转载自blog.csdn.net/hh1357102/article/details/130811544
今日推荐