紙のノート:SegNet:画像セグメンテーションのためのAディープ畳み込みエンコーダ・デコーダのアーキテクチャ

1つの概要

デコーダ構造 - セマンティックネットワーク構造は、符号器でトレーニングの終了をセグメンテーション--SegNetを提案しました。図13は、エンコーダ構造VGG16層の正面と同様であり、本論文の焦点は、避けるために、より少ないメモリを消費するだけでなく、サンプリング部だけでなく、インデックスのプールされたサンプリング方法の革新的な使用のデコーダ部分を記述する学習。道路網は、主に屋内のシーンのシーン分割タスクとタスクの部門で使用されるデータ収集およびデータのCamVid SUN RGB-Dデータの時に最良の結果を達成するために集中しています。

2つのハイライト

2.1ネットワークアーキテクチャ

2.1.1エンコーダ構造

エンコーダ構造は、坪VGG16に改善される:層を除去3完全に接続された層を形成した後、わずか13層をリード。これは大幅復号に作用する(以下、エンコーダ段において、さらに、スライディングウィンドウの最大位置が記録されるときに最大の細胞操作(14.7メートルまで134Mから)全体接続をもたらすためにレイヤパラメータの増加を減少させます構造)話す、2つのだけのビット。全体的に、セマンティックセグメンテーションとコーディング構造の変化は、この記事では、デコーダの構造を焦点を当てて、非常に大規模ではありません。

2.1.2デコーダ構造

ここに画像を挿入説明
サンプリングは、いくつかの失われた前符号化構造の両方を特徴付けることができるの詳細とき、デコーダの構造では、コーディング段階復元することができる画像のサイズ、及びサンプリング時間を作るためにネットワークFCN SegNetネットワークを復元するために必要です図融合(または重畳スプライシング)の段階を復号する、請求この利点は、多重階層映像符号化ステージニーズの欠点は、消耗を保存し、次いでオーバーレイまたは縫合することはもちろんの精度を向上させることです最もメモリ。本明細書において、代わりに全体図をダウンサンプリング特性最大値は、次に復号相が記録サンプリング位置情報の回復を使用して直接実行されるインデックス構造の符号化の時間を記録することによって、最大のプールのインデックスを記録します以下に示すような特徴は、図の境界においてより明確にすることができます。
ここに画像を挿入説明
サンプリングの方法は、右示しFCN(オーバーレイ)をサンプリングするための方法に、左番組にSegNetあります。SegNet別の利点をサンプリングするサンプリング位相で、復元するために学習することなく、直接ステージを符号化する場合、当然のことながら、セルのそれぞれの層の屈折率は、各層に対応するたびにプールされたサンプルのインデックスを保存することですアップサンプリングは、プールされたインデックスが特徴マップをサンプリングして得られた使用すると、スパースであるため、バックコンタクト層は、一連の機能が過剰適合を回避するために、緻密図プラスBN層となる作るために畳み込みカーネルをプールされました。

3つの結果

ここに画像を挿入説明ここに画像を挿入説明
画像ショー効果CamVid SegNetデータセットの他のネットワーク構造に比べ、より良好な可視SegNet。
ここに画像を挿入説明
ここに画像を挿入説明
画像が示す他のネットワーク構造、よりよい可視SegNetと効果SegNet SUN RGB-Dデータセットの比較。

4おわり

記事はこのプールされたサンプルのインデックスの方法は3つの利点を持っていることが示唆された:
①図は、境界がより明確にすることができることを特徴と。
パラメータの②多数の訓練によって減少させることができます。
その性能を向上させるために、セマンティックセグメンテーションネットワーク構造をデコード- ③広くコードに適用することができます。

5つの参考文献

(1)SegNet:画像セグメンテーションのためのAディープ畳み込みエンコーダ・デコーダアーキテクチャ
(2)[読書ノートが「SegNet:画像セグメンテーションのためのAディープ畳み込みエンコーダ・デコーダ・アーキテクチャ」
(3)紙の読み取りノート8:SegNet:Aディープ畳み込みエンコーダ画像のセグメンテーションのためのアーキテクチャ(IEEE2017)-Decoder

公開された24元の記事 ウォン称賛27 ビュー10000 +

おすすめ

転載: blog.csdn.net/gyyu32g/article/details/104315185