论文解读:D-LinkNetもしくは:LinkNetもしくは高解像度SatelliためPretrainedエンコーダおよび拡張型コンボリューションと

参考リンク:

投稿の北京大学と通信CVPR 2018 DeepGlobeは、彼らがこの衛星画像認識を行っている、ゲームに勝ちます

论文链接:D-LinkNetもしくは:LinkNetもしくは高解像度衛星画像道路抽出のためのPretrainedエンコーダおよび拡張型コンボリューションと

GithubのアドレスPython2.7 pytorch0.2.0


D-LinkNetもしくは:LinkNetもしくはPretrainedエンコーダーと高解像度衛星画像道路抽出のための拡張型コンボリューションと

要約:セマンティックセグメンテーションニューラルネットワーク、LinkNetもしくはアーキテクチャ、空のコンボリューション(畳み込み展開)

1.はじめに:

1つのピクセルレベルのタグの生成道路:道路画像抽出方法のほとんどは、3つのカテゴリに分類することができます。2.スケルトン検出道路。3.組み合わせの最初の2つの方法。

農産物の道路に、セマンティックセグメンテーションタスクバイナリピクセル・レベルのタグを抽出する方法として、我々はタスク。

道路のピクセルレベルの標識を生成するバイナリセマンティックセグメンテーションタスク

リモートセンシング画像分割が挑戦:1.高解像度を、全体像を含めることができ受容野の多くを持っているニューラルネットワークのニーズを必要とします。2.道路の衛星画像全体的に細長い、複合、画像全体の小さな部分を覆います。3.自然な方法通信区間。 

D_link_netプロフィール

その骨格としてD-LinkNetもしくはLinkNetもしくはプリコーダを用いて、中央部に追加の層拡張畳み込み(拡張型畳み込み)を有します。デコーダアーキテクチャの利点 - LinkNetもしくはセマンティックセグメントホップ接続を有する効果的なニューラルネットワーク、および残差ブロック符号化器です。高解像度かつ迅速に実行されています。

図拡張畳み込み方法の特徴の解像度を低下させることなく特徴点フィールド(受容のfi ELDより)感情を調節するのに有効です。

 転移学習を学習転送は例限られた量で、ネットワーク・パフォーマンス・データを改善するための効果的な方法です。D_linknetエンコーダはImagenet ResNet34構造で事前に訓練しています。

2.方法

2.1。ネットワークアーキテクチャ

       ゲームは、マスクのサイズ及び提供された画像が1024×1024、D-LinkNetもしくは1024×1024画像入力としてサイズ、および格納された詳述空間情報を受信するように設計されています。D-LinkNetもしくは三つの部分A、B、三つの部分、即ちエンコーダ、中央部及びデコーダのCに分割されます。

  LinkNetもしくはのみA、C機関、D_linknetは(中央部分である)のBを追加し、アクセスを拡大する範囲は、詳述した空間情報を維持します。

課題は、リモートネットワークセンターの中央部分の特徴点部分の受容野を高め、以前のアカウントに分割を取って議論し、道路の画像を感知し、かつ保持詳細な情報は非常に重要です。使用細胞層は、特徴点の受容野を乗算してもよいが、特徴マップの解像度、及び空間情報の損失を減少させることができます。したがって畳み込み空隙層は、好ましくは、代わりにプールを選択する層です。

拡張型畳み込み層は、層をプールするのが望ましい代替することができます。

D-LinkNetもしくはにスキップ接続を持ついくつかの拡張畳み込み層使用中央部を。

 拡大図の構造の中央部:

 上記のようにネットワークの中央部分は、図に示す並列構成を効果的にマルチスケールの特徴を融合させることができる、拡張することができます。拡張コンボリューションは、効果的に上から下への受容野に対応する、受容野を展開することができている31 15 7 3 1 、そして最終的に各ブランチの結果は農産物融合特性に追加されます。 二つのタイプの拡張畳み込み:カスケードモードとパラレルモード(カスケードモードとパラレルモード)。中央部は、ネットワークが異なるスケールで組み合わせることができるように、各パスの中空畳み込みカスケードモード、パラレルモード、および異なる受容野を含みます。

このうち、1,2,4,8は、拡張した割合を表しています。次の簡単な空の畳み込み、受容野を拡張する方法について説明します。

拡張畳み込み:空のコンボリューション(腫脹)、受容野を増加させるために、標準的な畳み込みマップにおける噴孔。膨張率は、カーネル・インターバルの数(例えば、通常の畳み込みが膨張率1である)を指します。

プーリング画像受容野サイズが増加を減少させる、他のアップサンプリングは、画像サイズを拡大します。次いで、前工程のサイズを増加減少し、一部の情報が失われるが存在しなければなりません。CONV拡張型は、しないことによりプーリングはまた、より多くの情報を参照するには、より大きな受容野を持つことができます。

拡張型の利点はされていませんプーリング各コンボリューション出力は、情報の広い範囲が含まれているので、こと、受容野を高め、情報の損失の場合を。

拡張型コンボリューション参照リンク

 D_Linknetデコーダ部1024×1024畳み込みアップサンプリング層、32×32からの特徴マップ解像度回復を転置されています。

3.実験セクション

 DeepGlobe道路抽出チャレンジ、深い学習の枠組みとしてPyTorchで。すべての4つのモデルは、訓練のNVIDIA GTX1080のGPUです。

3.1データセット

DeepGlobe道路抽出データセットは6226枚のトレーニング画像、1024×1024の解像度で1243枚の1101画像検証テスト画像を含みます。データセットは、道路がフォアグラウンド、バックグラウンドとしてマークされ、他のオブジェクトとしてマークされているバイナリセグメンテーションを表します。

3.2。実装の詳細

数据增强:水平FL IP、垂直FL IP、対角線FL IP、野心的なカラージッタ、画像シフト、スケーリングを含む野心的な方法でデータ増強、。

トレーニングモデル、損失クロスエントロピーとバイナリとダイス係数損失。

我々は損失関数として、BCE(バイナリクロスエントロピー)+サイコロCOEF Fiのcient損失を使用して、当社のオプティマイザとしてアダムを選びました。

3.3結果

ベースラインモデルとして使用ディープU-netは、また、私たち自身のD-LinkNetもしくはに連結された事前訓練を受けたLinkNet34を、テストしました。

U-netは、道路の連続性に間違った道として認識背景、LinkNet34の欠点があります。D-LinkNetもしくはこれらの2つのエラーを回避します。

4.おわりに

D-LinkNetもしくはある程度狭い道路特性、接続性、および複雑さの大きなスパンを扱うことができます。

 D-LinkNetもしくは、そのようなある程度の狭さ、接続性、複雑性と長いスパンとして道路のプロパティを処理することができます。 

 

 

公開された10元の記事 ウォン称賛10 ビュー7508

おすすめ

転載: blog.csdn.net/qq_41647438/article/details/105229562