4つのネットワークVGGNet

まず、特性

AlexNet、小さい畳み込みカーネルとのストライドの最初の層における畳み込み向上させる1、
2、マルチスケールトレーニング(訓練および試験、異なるスケールの全体マップ)

したがって、VGGシンプルな構造、特徴を抽出する機能、広範なアプリケーションのシナリオ

単一のスケールからの比較試験の結果:
ネットワークアーキテクチャ

異なる構造の第二に、比較

VGGは、ネットワークの6つのバージョンの合計を提供し、ネットワークは、異なるコントラストの効果を探索します。
ネットワーク設定の詳細のさまざまなバージョンについては、次の簡単な分析:

構造A:AlexNetと同様の、5層の畳み込みステージ、3完全接続層に分け、層は畳み込み3x3のコンボリューションカーネルのサイズであることを除いて、
構造A-LRN:AlexNetはLRNに保持;操作、その他の構成は同じである
ステージ2と3x3の畳み込みの層は、増加した畳み込みの10層の合計ステージ3;:構造B
、構造C:B、ステージ3、STAGE4、STAGE5の増加に基づいて、それぞれ1x1の畳み込み、畳み込み13層、合計16層の層、
構造D:C、ステージ3、STAGE4に基づいて、STAGE5層は、3x3の畳み込みを増加し、畳み込み層13、16の合計層、
構造E:ステージ3、STAGE4、に基づいてD、STAGE5層は、それぞれ畳み込み、16層、合計で19層を3x3の畳み込みを加えます。

コントラスト構造の図の効果

コントラストの各構成効果:

LRN-Aとの比較:-LRN Aなし良い結果、LRN効果は記載していない;
AはB、C、D、Eと比較される:層の数は、これらのうちBと比較して有効最小でありますC、D、E、より良い、より深い層記載;
BおよびC比較:1x1の畳み込みカーネルは、付加的な非線形効果リフトを追加する、増加させる、
比較例C及びD:3x3の畳み込みカーネル(構造D)比1×1を(構造C)効果良いです。(注!!!!)
C、D、Eとを比較し、マルチスケールの精度を向上させます

畳み込みカーネルの利点の第三に、議論

1.なぜ、3×3の畳み込みカーネルを使うのか?
(1)7×7等価受容野の畳み込みカーネルの受容野の3×3×3のコンボリューションカーネルが、追加の中間活性化関数、7×7畳み込みカーネルと比較して、深さより深い非線形増加
(2)パラメータの使用量削減:
(。C. 3×××3 C)= 27C 3 ^ 2×。
7. 7 = 49C×2 ^ C××C.
2,1×コンボリューションカーネルの役割1(。これら二つの機能を達成することができるが、パラメータは他とそれ以上)のコンボリューションカーネルであるが
、(1)非直線的に増加
(2)、及びL次元次元削減

第四に、トレーニングデータの前処理

最初のステップ:同性ズームの画像、256の最小辺長
ステップ2:ランダムに撮影した画像ブロックが224×224であります
第三段階:トリミングされた画像ブロック及びランダム水平反転変換RGB色

追加:あなたはまた、ネットワークに直接ではない濃密evalationトリミングされた画像を使用することができ、全体の層の代わりに畳み込み層の背面に接続されます

おすすめ

転載: www.cnblogs.com/liuboblog/p/11622132.html