多通道卷积计算过程

对于单通道图像，若利用10个卷积核进行卷积计算，可以得到10个特征图；若输入为多通道图像，则输出特征图的个数依然是卷积核的个数（10个）。
1.单通道多个卷积核卷积计算
在这里插入图片描述

一个卷积核得到的特征提取是不充分的，我们可以添加多个卷积核，比如32个卷积核，从而可以学习32种特征。

2.多通道多个卷积核卷积计算
图片：假设图片的宽度为width:W，高度为height:H，图片的通道数为D，一般目前都用RGB三通道D=3，为了通用性，通道数用D表示；
卷积核：卷积核大小为KK，由于处理的图片是D通道的，因此卷积核其实也就是KKD大小的，因此，对于RGB三通道图像，在指定kernel_size的前提下，真正的卷积核大小是kernel_sizekernel_size3。
对于D通道图像的各通道而言，是在每个通道上分别执行二维卷积，然后将D个通道加起来，得到该位置的二维卷积输出，对于RGB三通道图像而言，就是在R，G，B三个通道上分别使用对应的每个通道上的kernel_sizekernel_size大小的核去卷积每个通道上的W*H的图像，然后将三个通道卷积得到的输出相加，得到二维卷积输出结果。因此，若有M个卷积核，可得到M个二维卷积输出结果，在有padding的情况下，能保持输出图片大小和原来的一样，因此是output(W,H,M)。
在这里插入图片描述

import numpy as np
import tensorflow as tf

a = np.zeros((4, 4, 3))
a[:, :, 0] = [[1.0, 1.0, 1.0, 1.0], [1.0, 1.0, 1.0, 1.0],
              [1.0, 1.0, 1.0, 1.0], [1.0, 1.0, 1.0, 1.0]]
a[:, :, 1] = [[2.0, 2.0, 2.0, 2.0], [2.0, 2.0, 2.0, 2.0],
              [2.0, 2.0, 2.0, 2.0], [2.0, 2.0, 2.0, 2.0]]
a[:, :, 2] = [[3.0, 3.0, 3.0, 3.0], [3.0, 3.0, 3.0, 3.0],
              [3.0, 3.0, 3.0, 3.0], [3.0, 3.0, 3.0, 3.0]]
a_tensor = tf.reshape(a, (1, 4, 4, 3))


filter_ = np.array([[[[0.1, 0.1], [0.1, 0.1], [0.1, 0.1]],
                     [[0.2, 0.2], [0.2, 0.2], [0.2, 0.2]],
                     [[0.3, 0.3], [0.3, 0.3], [0.3, 0.3]]]])

filter_ = np.zeros((2,2,3))
filter_[:,:,0] = [[0.1, 0.1], [0.1, 0.1]]
filter_[:,:,1] = [[0.2, 0.2], [0.2, 0.2]]
filter_[:,:,2] = [[0.3, 0.3], [0.3, 0.3]]
print(filter_.shape)
filter_tensor = tf.reshape(filter_, (2,2,3,1))


conv1 = tf.nn.conv2d(a_tensor, filter_tensor, strides=[1, 2, 2, 1], padding='SAME')

with tf.Session() as sess:
    out = sess.run(conv1)
    print(sess.run(a_tensor)[0, :, :, 1])
    print(sess.run(filter_tensor)[:,:,0,0])
    print(out.shape)
    print(out[0,:,:,0])

参考

https://blog.csdn.net/jacke121/article/details/80188821

wangwang的博客

发布了9 篇原创文章 · 获赞 0 · 访问量 168

私信关注

多通道卷积计算过程

多通道卷积计算过程

猜你喜欢