论文解读1 - 正確な物体検出およびセマンティックセグメンテーションのための豊富な機能階層

背景

  2012 Imagenet LSVRCゲームでは、簡単の15.3%のAlexnetがトップ5にすると、エラーレートがトップ(26.2パーセントの第二のトップ5の誤り率)に出てきます。このように、convNet電位が広くヒット、認識されています。convNetは、画像分類タスクで良い結果を達成することができますので、それはまた、目標検出タスクの上に置くことができますされていません。本論文では、ターゲット検出タスクを解決convNet使用を探求する最初のものです。PASCAL VOC 2010マップは53.7パーセントに達しました。

方法

  モデルは完全に3つのモジュールに分割しました。

  (1)領域提案(面積が推奨))。ターゲット検出タスクは分類を行うことだけではありませんので侯は、上記の全景のボックスの多くを生産、ゴールボックスを遂行しなければなりませんでした。実際には、ここでは、思考のトラバーサル、ターゲットリストにすべての最初の可能な位置、および1つの分類によって、その後1です。ここで使用される選択検索アルゴリズムがあります。

  (2)特徴抽出(特徴抽出)。バックFCため* 3 224 * 224にリサイズするサブ画像を生成する、この部分は、特徴抽出(注AlexNet第5 CONV層とフロント2つのFC層によって上に】* 3 224 * 224の画像を生成することです層を受信する固定長ベクトルである)、それは、最終的に、特徴ベクトルの4096-Dが生成されます。

  (3)SVM分類。4096-Dの各々についてのSVM分類特徴ベクトルを使用する方法。FC層の一つが続く元の分類AlexNetは、ベクター4096-Dは、(N、クラスの数である)のNdに変換されることに注意し、次にソフトマックス分類アルゴリズムを行います。実験SVM方法が良いので、著者らは、このメソッドを使用していない理由。

概要

  次いでNを生成するAlexNet(FC-ソフトマックス層を除去)に投入された224 * 224 * 3、サブグラフリサイズする図選択的探索アルゴリズムの全体図でn番目を生成するために、見出され、RCNN単純な原理であることができます4096-Dは、SVM分類アルゴリズムを有するベクトルです。

  より多くの人々がconvNetによって目標検出の問題を解決できるようにするために山convNetによって目標検出の問題を解決するように、その貢献度、従来の方法よりもマップモデル、。

短所

  (1)コースの欠点は、画像が、シート部分グラフの数千人を作るディスクスペースの多くを取るために、最初にこのあまりにも暴力的な明白です。

  (2)非効率性があり、我々は、冗長な多数の計算で、その結果、確かにオーバーラップする部分の多くは、これらの重複部分を別々に計算する必要がありました写真の数千人を見つけることができます。

おすすめ

転載: www.cnblogs.com/xin1998/p/11371615.html