io.imread和cv2.imread以及 transform.resize和cv2.resize区别

Tensorflow中，在训练图片数据之前，需要先对图片进行预处理，读图和裁剪是最基本的两步。常见的的读图何裁剪分别有两种方式，这里小编将和大家分享下这几种方式的实现以及他们之间的区别。

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint8，value是numpy array 类型。对于RGB 图片，图像数据是以RGB 的格式进行存储的。

2.cv2.imread读出的图片格式是uint8 ,value也是numpy array 类型。唯一的区别是，图像数据格式是以BGR的格式进行存储的。需要将存储类型改成RGB 的形式才能正常显示原图的颜色。特别是制作tfrecord 时，需要将图片通道改成RGB，具体代码如下。


    
    
     
     
      
      
       
       
      
      
      
      
       
       
        
        import cv2
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        import matplotlib.pyplot 
        
        as plt
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        from skimage 
        
        import transform 
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        import numpy 
        
        as np
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        import skimage.io 
        
        as io  
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        train_dir = 
        
        'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        '''以cv2方式读取图片'''
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        image=cv2.imread(train_dir)
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        b,g,r = cv2.split(image)     
        
        #将图像通道分离开
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        rgb_image = cv2.merge([r,g,b]) 
        
        #以RGB的形式重新组合
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  也可以使用这个函数直接转换成RGB 形式
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        plt.imshow(rgb_image)
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        '''以io.imread方式读取图片'''
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        #image = io.imread(train_dir)  #读图并显示  
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        #plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的，数值的取值范围是（0~255）

2.通过transform.resize()裁剪后的图片是以 float64的格式存储的，数值的取值范围是（0~1）。通常在制作tfrecord 数据集的过程中，我们需要将其转换成numpy array的形式，具体代码如下


    
    
     
     
      
      
       
       
      
      
      
      
       
       
        
        '''以io.imread方式读取图片并使用transform形式裁剪图片'''
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        image = io.imread(train_dir)  
        
        #读图并显示  
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        plt.imshow(image)
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        image =transform.resize(image, (
        
        208, 
        
        208))
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        img = image * 
        
        255   
        
        #将图片的取值范围改成（0~255）
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        img = img.astype(np.uint8)   
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        plt.imshow(img)

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint8，value是numpy array 类型。对于RGB 图片，图像数据是以RGB 的格式进行存储的。


    
    
     
     
      
      
       
       
      
      
      
      
       
       
        
        import cv2
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        import matplotlib.pyplot 
        
        as plt
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        from skimage 
        
        import transform 
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        import numpy 
        
        as np
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        import skimage.io 
        
        as io  
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        train_dir = 
        
        'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        '''以cv2方式读取图片'''
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        image=cv2.imread(train_dir)
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        b,g,r = cv2.split(image)     
        
        #将图像通道分离开
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        rgb_image = cv2.merge([r,g,b]) 
        
        #以RGB的形式重新组合
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  也可以使用这个函数直接转换成RGB 形式
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        plt.imshow(rgb_image)
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        '''以io.imread方式读取图片'''
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        #image = io.imread(train_dir)  #读图并显示  
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        #plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的，数值的取值范围是（0~255）


    
    
     
     
      
      
       
       
      
      
      
      
       
       
        
        '''以io.imread方式读取图片并使用transform形式裁剪图片'''
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        image = io.imread(train_dir)  
        
        #读图并显示  
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        plt.imshow(image)
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        image =transform.resize(image, (
        
        208, 
        
        208))
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        img = image * 
        
        255   
        
        #将图片的取值范围改成（0~255）
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        img = img.astype(np.uint8)   
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
        
       
       
      
      
     
     
      
      
       
       
      
      
      
      
       
       
        
        plt.imshow(img)

https://blog.csdn.net/qq_24193303/article/details/79970819

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint8，value是numpy array 类型。对于RGB 图片，图像数据是以RGB 的格式进行存储的。


  
  
   
   
    
    
     
     
    
    
    
    
     
     
      
      import cv2
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      import matplotlib.pyplot 
      
      as plt
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      from skimage 
      
      import transform 
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      import numpy 
      
      as np
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      import skimage.io 
      
      as io  
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      train_dir = 
      
      'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      '''以cv2方式读取图片'''
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      image=cv2.imread(train_dir)
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      b,g,r = cv2.split(image)     
      
      #将图像通道分离开
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      rgb_image = cv2.merge([r,g,b]) 
      
      #以RGB的形式重新组合
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  也可以使用这个函数直接转换成RGB 形式
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      plt.imshow(rgb_image)
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      '''以io.imread方式读取图片'''
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      #image = io.imread(train_dir)  #读图并显示  
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      #plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的，数值的取值范围是（0~255）


  
  
   
   
    
    
     
     
    
    
    
    
     
     
      
      '''以io.imread方式读取图片并使用transform形式裁剪图片'''
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      image = io.imread(train_dir)  
      
      #读图并显示  
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      plt.imshow(image)
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      image =transform.resize(image, (
      
      208, 
      
      208))
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      img = image * 
      
      255   
      
      #将图片的取值范围改成（0~255）
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      img = img.astype(np.uint8)   
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      plt.imshow(img)

一、常见的两种读图方式 io.imread() 和 cv2.imread()

1.io.imread 读出的图片格式是uint8，value是numpy array 类型。对于RGB 图片，图像数据是以RGB 的格式进行存储的。


  
  
   
   
    
    
     
     
    
    
    
    
     
     
      
      import cv2
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      import matplotlib.pyplot 
      
      as plt
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      from skimage 
      
      import transform 
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      import numpy 
      
      as np
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      import skimage.io 
      
      as io  
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      train_dir = 
      
      'E:/TensorFlow/Project_TF/flower_tfrecord/data/test/roses/timg.jpg'
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      '''以cv2方式读取图片'''
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      image=cv2.imread(train_dir)
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      b,g,r = cv2.split(image)     
      
      #将图像通道分离开
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      rgb_image = cv2.merge([r,g,b]) 
      
      #以RGB的形式重新组合
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      #image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)  也可以使用这个函数直接转换成RGB 形式
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      plt.imshow(rgb_image)
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      '''以io.imread方式读取图片'''
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      #image = io.imread(train_dir)  #读图并显示  
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      #plt.imshow(image)

二、常见的两种图片裁剪方式 cv2.resize() 和 transform.resize()

1.通过cv2.resize()裁剪后的图片还是以 numpy array 的方式保存的，数值的取值范围是（0~255）


  
  
   
   
    
    
     
     
    
    
    
    
     
     
      
      '''以io.imread方式读取图片并使用transform形式裁剪图片'''
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      image = io.imread(train_dir)  
      
      #读图并显示  
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      plt.imshow(image)
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      image =transform.resize(image, (
      
      208, 
      
      208))
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      img = image * 
      
      255   
      
      #将图片的取值范围改成（0~255）
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      img = img.astype(np.uint8)   
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
      
     
     
    
    
   
   
    
    
     
     
    
    
    
    
     
     
      
      plt.imshow(img)

https://blog.csdn.net/qq_24193303/article/details/79970819

io.imread和cv2.imread以及 transform.resize和cv2.resize区别

猜你喜欢