CNN中的图像矩阵变换

1)opencv 默认读进去的是bgr的顺序,下面操作将bgr转为rgb

mg = cv2.resize(img, (config.input_size[1], config.input_size[0]))
img = img[:, :, (2, 1, 0)]//将bgr转rgb

 

2)opencv读入图片的矩阵格式是:(height,width,channels)。而在深度学习中,因为要对不同通道应用卷积,所以会采取另一种方式,channel first:(channels,height,width)。为了应对该要求,可以这么做:

print(img.shape)

img = img.transpose(2,0,1)

print(img.shape)

 

3)在深度学习搭建CNN时,往往要做相应的图像数据处理,比如图像要扩展维度,比如扩展成(batch_size,channels,height,width)。对于这种要求,可以这么做:

#有时候还要扩展维度,比如有时候我们需要预测单张图片,要在要加一列做图片的个数,可以这么做:

img = np.expand_dims(img, axis=0)

print(img.shape)

 

注意:

上面提到的是预测阶段时预测单张图片的扩展维度的操作,如果是训练阶段,构建batch,即得到这种形式:(batch_size,channels,height,width)。可以这么做:

data_list = []

loop:

  im = cv2.imread('xxx.png')

  data_list.append(im)

data_arr = np.array(data_list)

发布了191 篇原创文章 · 获赞 104 · 访问量 34万+

猜你喜欢

转载自blog.csdn.net/u013925378/article/details/102695043