深度学习中single crop / multiple crops evaluation/test 是什么意思

最近在ResNet论文中看到了

标准的10-crop测试,此处小记一下。

对于一个分类网络,在测试阶段,使用single crop/multiple crop得到的结果是不一样的,相当于将测试图像做数据增强

shicaiyang(星空下的巫师)说[1],训练的时候当然随机剪裁,但测试的时候有技巧:

  • 单纯将测试图像resize到某个尺度(例如256xN),选择其中center crop(即图像正中间区域,比如224x224),作为CNN的输入,去评估该模型
  • Multiple Crop的话具体形式有多种,可自行指定,比如:
    • 10个crops: 取(左上,左下,右上,右下,正中)以及它们的水平翻转。这10个crops在CNN下的预测输出取平均作为最终预测结果。
    • 144个crops:这个略复杂,以ImageNet为例:
      • 首先将图像resize到4个尺度(比如256xN,320xN,384xN,480xN)
      • 每个尺度上去取(最左,正中,最右)3个位置的正方形区域
      • 对每个正方形区域,取上述的10个224x224的crops,则得到4x3x10=120个crops
      • 对上述正方形区域直接resize到224x224,以及做水平翻转,则又得到4x3x2=24个crops
      • 总共加起来得到120+24=144个crops,所有crops的预测输出的平均作为整个模型对当前测试图像的输出
发布了210 篇原创文章 · 获赞 71 · 访问量 8万+

猜你喜欢

转载自blog.csdn.net/IT_flying625/article/details/104900050
今日推荐