版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhongqianli/article/details/85651974
项目地址:https://github.com/zhongqianli/caffe_googlenet
22层的深度网络,引入了Inception模块,使用了多个loss。使用1x1的bottleneck,用于增加网络的深度和宽度,可以减少计算量。最后使用了avg pool。
解决的问题
提出了一种高效的深度学习框架,代号为Inception,它受到NiN网络的启发。
1x1conv
简单说,是特征降维,是feature pooling,filter space的transform。这种跨特征层的级联结构,可以有助于不同特征层间的空间信息交互。
细节
为了避免patch-alignment问题, 卷积核的尺寸限定为1×1, 3×3 和 5×5。
网络的设计遵循了这样的规则:视觉信息应该在不同尺寸进行处理,然后将它们合并在一起供下一阶段使用。
多个loss的作用
改善深度网络的收敛性。(《Rethinking the Inception Architecture for Computer Vision》的作者认为是充当正则化器)