畳み込みニューラル ネットワークで 1x1 畳み込みカーネルは何を行うのか

1. クロスチャネルの情報連携と統合を実現します。1x1 コンボリューション カーネルにはパラメータが 1 つだけあります。マルチチャネルの特徴マップに作用する場合、それは異なるチャネルの線形結合と同等です。実際には、係数が加算され乗算されますが、出力の特徴マップは複数の値になります。チャネルの統合された情報により、ネットワークによって抽出された特徴を強化できます。

2. 特徴マップチャネル数の次元削減。次元削減の役割は GoogLeNet と ResNet によく反映されています。例: 入力特徴の次元が 100x100x128、畳み込みカーネル サイズが 5x5 (ストライド = 1、パディング = 2)、チャネル数が 256 であるとします。その場合、畳み込み後の出力特徴の次元は 100x100x256、畳み込みパラメーターは次のようになります。 128x5x5x256=819200。このとき、5x5 畳み込みの前に 64 チャネルの 1x1 畳み込みが使用され、最終的な出力特徴の次元は依然として 100x100x256 ですが、このときの畳み込みパラメータの量は 128x1x1x64 + 64x5x5x256=417792 となり、パラメータの量が 1 つ削減されます。半分ぐらい。

おすすめ

転載: blog.csdn.net/qq_45560230/article/details/132145850