深度学习网络的结构---AlexNet

AlexNet是一个经典的深度学习模型,是2012年ImageNet大规模视觉识别竞赛(ImageNet Large Scale Visual Recognition Challenge,ILSVRC)的冠军模型。它是一个基于卷积神经网络(CNN)的模型,其结构如下:

- 输入层:输入图像的尺寸是227x227x3。
- 卷积层1:96个11x11的卷积核,步长为4,使用ReLU激活函数,其中的卷积操作会使得输出大小为55x55x96。
- 池化层1:使用max-pooling,核大小为3x3,步长为2。这会把输出的尺寸缩小一半,变成27x27x96。
- 卷积层2:256个5x5的卷积核,步长为1,使用ReLU激活函数,这会输出一个尺寸为27x27x256的特征图。
- 池化层2:使用max-pooling,核大小为3x3,步长为2。这会将输出的尺寸缩小一半,变成13x13x256。
- 卷积层3:384个3x3的卷积核,步长为1,使用ReLU激活函数,这会输出一个尺寸为13x13x384的特征图。
- 卷积层4:384个3x3的卷积核,步长为1,使用ReLU激活函数,这会输出一个尺寸为13x13x384的特征图。
- 卷积层5:256个3x3的卷积核,步长为1,使用ReLU激活函数,这会输出一个尺寸为13x13x256的特征图。
- 池化层3:使用max-pooling,核大小为3x3,步长为2,这会将输出的尺寸缩小一半,变成6x6x256。
- 全连接层1:4096个神经元,使用ReLU激活函数。
- 全连接层2:4096个神经元,使用ReLU激活函数。
- 输出层:使用一个1000个神经元的softmax分类器来对图像进行分类。

整个AlexNet模型有62 million个参数。

猜你喜欢

转载自blog.csdn.net/qq_16032927/article/details/131389190