5画像処理と深い学習 - 読書ノート

 

このノートでは、第5章PaddlePaddlePPT内容に応じて統合をまとめたもの。

  1. アウトライン

1.1対象の画像認識

1.2画像認識の挑戦

Lセマンティックギャップ(セマンティックギャップ)現象:底部および上部ギャップ意味概念間の画像の視覚特性

基本的なフレーム画像認識1.3

宇宙カテゴリ特徴空間の測定空間

  1. 従来の画像認識技術

2.1初期の画像認識技術(1990から2003)

2.1.1特徴抽出

Lグローバル特徴抽出:グローバル根底の視覚特性の統計によって表される画像

画像は、ベクトルとして表される:元の画像ベクトル空間マッピングベクトル表現

グローバル機能例1:色、テクスチャ特徴量、形状特徴

フィーチャーリットル変換は:パフォーマンス向上機能を表し

Lマニホールド(マニホールド学習)学習:低次元空間におけるベクトルとして表さ高次元データのマッピングを

センタリング、正規、非相関性、美白:lは、単純な機能を変換します

2.1.2インデックス

2.1.3適合フィードバック

2.1.4並べ替え

2.2中間画像認識技術(2003から2012)

2.2.1特徴抽出

Lローカル機能(ローカル機能):画像ブロック(パッチ)ベクトル

L前記検出器(特徴検出器):画像ブロックの中心位置を検出する(関心点)

L特性記述子(特徴Desciptor):ビジュアルコンテンツ記述ブロック

Lローカル検出サブ:ハリス、犬、SURF、ハリスアフィン、ヘッセアフィン、MSER

L局所記述子:、SIFT PCA-SIFT、GLOH、コンテキストの形状、ORB、COGE

2.2.2ベクトル化

視覚的な単語にL局所特徴(すなわち量子化された特徴、機能の量子化):変換イメージIDのための視覚的単語、局所的な特徴ベクトルを探します

lの量子化技術の共通の特徴:階層1-NN、KD-ツリー

Lは、視覚単語に基づいて画像を表します。

ローカル画像特徴視覚的な言葉、視覚単語ヒストグラムバッグ→

2.2.3インデックス

リットル転置インデックス

L分類:TF-IDF重み付け(用語頻度 - 逆文書頻度)

2.2.4治療

クエリ拡張L:より多くのクエリ用語を含む、オリジナルの局所的な特徴となるよう、そして拡張されたクエリ

他の後処理技術L:ローカル幾何検証(ローカル幾何学的検証)、量子化製品(製品量子化)

  1. 深さの学習と画像認識

3.1深学習開発プロセス

画像の分野におけるアプリケーションL深さ研究:画像検索、異常な腫瘍を同定、画像記述、着色画像

3.2なぜ深い学習を使用

リットル人間の脳の視覚メカニズム:1)感情の段階に応じて - 情報収集2)視覚の段階 - 認知情報

ニューラル1 - 中心 - 脳:吸気原信号(ピクセル) - 予備処理(エッジ方向) - 抽象(形状) - 抽象以上(具体的にはオブジェクト)

深い学習を使用する方法3.3

画像認識深学習ソリューションを使用する方法3.3.1

所望Lの機械学習(学習の深さ)を使用して:適切な機能を見つけること

3.3.2これらの手順を実行します。モデリング(人)、機能の喪失(人)、パラメータ学習(機械)

3.3.3モデル

L一般的な活性化機能:シグモイド、双曲線正接、ARCTAN、ReLU、PReLU

Lプレニューラルネットワーク:入力層、中間層→→出力層

例リットルモデル:AlexNet、VGG、GoogleNet、残留ネット

出力層L:出力層の関数としてソフトマックス活性化関数、よりよい計算さ理解しやすいです

Lは、適切なネットワーク構造を提供し:層の数、ノードの数、活性化関数を

3.3.4損失関数

一般的損失関数L:二次損失関数、クロスエントロピー損失関数

lの全損失:

3.3.5パラメータ学習

リットルの勾配降下:

リットルのバックプロパゲーション:連鎖法則

  1. 実践コース

lの顔認識

 

おすすめ

転載: www.cnblogs.com/Kobaayyy/p/11027639.html