深度学习两种图像数据预处理具体方法 深度学习两种图像数据预处理具体方法

深度学习两种图像数据预处理具体方法

vgg 预处理

输入图片 height, width

RESIZE_SIDE_MIN = 256

RESIZE_SIDE_MAX = 512

R_MEAN = 123.68G_MEAN = 116.78B_MEAN = 103.94

训练预处理

  1. scale = width < height ? small_size / width : small_size / height 其中 small_size 为 RESIZE_SIDE_MIN 到 RESIZE_SIDE_MAX 的随机数
  2. new_width = width * scale new_height = height * scale
  3. 用二分插值法将 (height, width) 转为 (new_height, new_width)
  4. 将 new_height, new_width 的图片 crop 为 crop_height(224), crop_width(224) 其中必须满足 new_height >= crop_height, new_width >= crop_width
  5. 将图片左右翻转(50% 的概率会翻转)
  6. RGB 分别减去其平均值,其中依次为 R_MEAN, G_MEAN B_MEAN

测试预处理

  1. 用二分插值法将 (height, width) 转为 (new_height, new_width) 其中 new_height = new_width = 256
  2. 从 crop 中心的 crop_height, crop_width
  3. RGB 分别减去其平均值,其中依次为 R_MEAN, G_MEAN B_MEAN

采用上述预处理方法的模型

  • resnet_v1_50
  • resnet_v1_101
  • resnet_v1_152
  • resnet_v1_200
  • resnet_v2_50
  • resnet_v2_101
  • resnet_v2_152
  • resnet_v2_200
  • vgg
  • vgg_a
  • vgg_16
  • vgg_19

inception 预处理

训练预处理

  1. 对图片进行随机 crop, 使其与 bbox 的重叠部分大于 0.1,长宽比在 (0.75, 1.33) 之间,croped 之后的图片大小为原图的(0.05, 1.0)。
  2. 将 crop 之后的图片大小 resize 为 crop_height(224), crop_width(224)
  3. 将 crop 图片左右翻转(50% 的概率会翻转)
  4. 调整 crop 图片的亮度(32. / 255.)和饱和度(0.5, 1.5)
  5. 每个元素减去 0.5,再乘以 2.0

测试预处理

  1. central crop
  2. 二分法插值,将图片变为 height, width
  3. 每个元素减去 0.5,再乘以 2.0

采用上述预处理方法的模型

  • inception
  • inception_v1
  • inception_v2
  • inception_v3
  • inception_v4
  • inception_resnet_v2
  • mobilenet_v1
  • nasnet_mobile
  • nasnet_large
  • pnasnet_large,

vgg 预处理

输入图片 height, width

RESIZE_SIDE_MIN = 256

RESIZE_SIDE_MAX = 512

R_MEAN = 123.68G_MEAN = 116.78B_MEAN = 103.94

训练预处理

  1. scale = width < height ? small_size / width : small_size / height 其中 small_size 为 RESIZE_SIDE_MIN 到 RESIZE_SIDE_MAX 的随机数
  2. new_width = width * scale new_height = height * scale
  3. 用二分插值法将 (height, width) 转为 (new_height, new_width)
  4. 将 new_height, new_width 的图片 crop 为 crop_height(224), crop_width(224) 其中必须满足 new_height >= crop_height, new_width >= crop_width
  5. 将图片左右翻转(50% 的概率会翻转)
  6. RGB 分别减去其平均值,其中依次为 R_MEAN, G_MEAN B_MEAN

测试预处理

  1. 用二分插值法将 (height, width) 转为 (new_height, new_width) 其中 new_height = new_width = 256
  2. 从 crop 中心的 crop_height, crop_width
  3. RGB 分别减去其平均值,其中依次为 R_MEAN, G_MEAN B_MEAN

采用上述预处理方法的模型

  • resnet_v1_50
  • resnet_v1_101
  • resnet_v1_152
  • resnet_v1_200
  • resnet_v2_50
  • resnet_v2_101
  • resnet_v2_152
  • resnet_v2_200
  • vgg
  • vgg_a
  • vgg_16
  • vgg_19

inception 预处理

训练预处理

  1. 对图片进行随机 crop, 使其与 bbox 的重叠部分大于 0.1,长宽比在 (0.75, 1.33) 之间,croped 之后的图片大小为原图的(0.05, 1.0)。
  2. 将 crop 之后的图片大小 resize 为 crop_height(224), crop_width(224)
  3. 将 crop 图片左右翻转(50% 的概率会翻转)
  4. 调整 crop 图片的亮度(32. / 255.)和饱和度(0.5, 1.5)
  5. 每个元素减去 0.5,再乘以 2.0

测试预处理

  1. central crop
  2. 二分法插值,将图片变为 height, width
  3. 每个元素减去 0.5,再乘以 2.0

采用上述预处理方法的模型

  • inception
  • inception_v1
  • inception_v2
  • inception_v3
  • inception_v4
  • inception_resnet_v2
  • mobilenet_v1
  • nasnet_mobile
  • nasnet_large
  • pnasnet_large,

猜你喜欢

转载自blog.csdn.net/qq_15098623/article/details/87888713