特性と分類 - 「畳み込みニューラルネットワークコンピュータビジョン」の研究ノート

  特徴抽出と分類は、一般的なコンピュータビジョンシステムの二つの重要な段階です。視覚システムの精度、ロバスト性及び効率は画像特徴と分類器の品質に大きく依存します。特徴抽出方法は、手動の方法と特徴に基づく学習アプローチに基づいて2つの異なるカテゴリに分けることができます。分類器は二つのグループ、すなわち浅いと深いモデルのモデルに分けることができます。

  コンピューティングタスクを解決するために、特定のアプリケーションに関連付けられている任意のユニークな側面や特性を備えています。n個の特徴の組合せは、特徴ベクトルと呼ばれ、n次元ベクトルとして表すことができます。品質特徴ベクトルは、画像サンプルの異なるカテゴリを区別する能力に依存します。グッド機能は、ノイズや一連の変換の影響から、情報が豊富であること、および高速な計算すべきです。

  分類は、現代のコンピュータビジョンとパターン認識の中核です。分類は、画像または関心領域(ROI)分割されたカテゴリを使用して、特徴ベクトルのタスクです。難易度は、変動の同じクラスの画像から特徴量分類タスク、および値の異なるクラスから画像特徴との差に依存します。しかし、ノイズ(斜線、閉塞、遠近歪み、等)ので、異常値(例えば、画像「構成」カテゴリは、人々を含んでいてもよい)、曖昧さ(例えば、同一の矩形形状は、建物のテーブルや窓に対応することができます) 、ラベルの欠落、わずかなトレーニングサンプルが用意されていて、正と負の訓練の不均衡は、データサンプルをカバーしています。その結果、分類器の設計上の決定は困難な作業です。

  

伝統的な特徴記述子:伝統的な(手動設計)2つのカテゴリに分類された特徴抽出法:グローバルとローカル。グローバル特徴抽出方法は、効果的に画像全体を説明し、したがって、形状の詳細は無視されるグローバル機能のセットを定義します。グローバルな特徴は、閉塞物体認識部には適用されません。一方、臨界点を中心に局所的な領域を抽出する局所特徴抽出方法は、それがより良いハンドル閉塞することが可能です。ここではいくつかの局所特徴抽出方法があります。

    (1)HOG記述子 - 画像エッジ方向ヒストグラム内のオブジェクトの形状及び外観を説明します。実装は、4つのステップに分かれています。

      1.勾配計算。画像の水平方向および垂直方向に、一次元の離散微分テンプレートを行うセンター。

      2.方向ヒストグラムユニット。各画素における勾配の絶対加重勾配方向間隔に基づいて、セル内の各画素は、キャスト得票します。

      3.記述子ブロック。光と対照的に、ハンドル変更するために、セル内のより多くのスペースに隣接するブロックを介して一緒に局所的に正規化された勾配強度を形成します。HOG記述子は、全ての領域からの細胞成分のベクトル正規化ヒストグラムです。

      4.ブロックのリターン。L1またはL2ノルムノルムにより正規化することができます。

    (2)SIFT--規模不変の機能は、変換します

      オブジェクトのSIFT機能セットを提供し、拡大縮小や回転機能のためのこれらのオブジェクトは、堅牢です。次の4つのステップに分け:

      スケール空間を検出1.極値。ガウシアン(イヌ)の使用SIFT差は、局所極値を探索するために全てのスケール及び画像位置における犬の画像を検索します。

      2.キーポイント正確な位置決め。エッジ上の低コントラスト又は局所弱点を持つものを探して、このステップでは、リストからの潜在的な不安定点のキーポイントを削除します。

      3.位置決め方向。各キーのための局所的な画像特性に基づいて画像の回転不変性を実現するために一定の方向を割り当てられます。これは、キーポイントディスクリプタの方向に関して表すことができます。

      4.キー記述子

      長年にわたり、複雑な数学的なアイデア、研究の必要性をSIFT。

    (3)SURF--加速ロバスト特徴

      SURFは、SIFTの加速バージョンです。SIFTガウスラプラスではスケール空間を構築するために、犬に近似していました。SURFは、このプロセスを加速するためにフィルターカートリッジログを用いて推定しました。

    伝統的な手のエンジニアリング機能の限界

    コンピュータビジョンの進歩は、手動エンジニアリング機能に基づいています。しかし、特性エンジニアの難しさ、時間がかかり、問題の分野の専門知識を必要とします。もう一つの欠点は、情報の面であまりにもまばらな手作りの作品を備えていた画像からキャプチャすることができないということです。な深さとして、ニューラルネットワークの使用は、自動学習アルゴリズムは、これらすべての問題を解決することができます。

おすすめ

転載: www.cnblogs.com/candyRen/p/11988753.html