GoogleNet学习与实现

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/zhongqianli/article/details/85651974

项目地址:https://github.com/zhongqianli/caffe_googlenet

22层的深度网络,引入了Inception模块,使用了多个loss。使用1x1的bottleneck,用于增加网络的深度和宽度,可以减少计算量。最后使用了avg pool。

解决的问题

提出了一种高效的深度学习框架,代号为Inception,它受到NiN网络的启发。

1x1conv

简单说,是特征降维,是feature pooling,filter space的transform。这种跨特征层的级联结构,可以有助于不同特征层间的空间信息交互。

细节

为了避免patch-alignment问题, 卷积核的尺寸限定为1×1, 3×3 和 5×5。
网络的设计遵循了这样的规则:视觉信息应该在不同尺寸进行处理,然后将它们合并在一起供下一阶段使用。

多个loss的作用

改善深度网络的收敛性。(《Rethinking the Inception Architecture for Computer Vision》的作者认为是充当正则化器)

猜你喜欢

转载自blog.csdn.net/zhongqianli/article/details/85651974
今日推荐