このノートでは、第5章PaddlePaddlePPT内容に応じて統合をまとめたもの。
- アウトライン
1.1対象の画像認識
1.2画像認識の挑戦
Lセマンティックギャップ(セマンティックギャップ)現象:底部および上部ギャップ意味概念間の画像の視覚特性
基本的なフレーム画像認識1.3
宇宙カテゴリ特徴空間の測定空間
- 従来の画像認識技術
2.1初期の画像認識技術(1990から2003)
2.1.1特徴抽出
Lグローバル特徴抽出:グローバル根底の視覚特性の統計によって表される画像
画像は、ベクトルとして表される:元の画像ベクトル空間マッピングベクトル表現
グローバル機能例1:色、テクスチャ特徴量、形状特徴
フィーチャーリットル変換は:パフォーマンス向上機能を表し
Lマニホールド(マニホールド学習)学習:低次元空間におけるベクトルとして表さ高次元データのマッピングを
センタリング、正規、非相関性、美白:lは、単純な機能を変換します
2.1.2インデックス
2.1.3適合フィードバック
2.1.4並べ替え
2.2中間画像認識技術(2003から2012)
2.2.1特徴抽出
Lローカル機能(ローカル機能):画像ブロック(パッチ)ベクトル
L前記検出器(特徴検出器):画像ブロックの中心位置を検出する(関心点)
L特性記述子(特徴Desciptor):ビジュアルコンテンツ記述ブロック
Lローカル検出サブ:ハリス、犬、SURF、ハリスアフィン、ヘッセアフィン、MSER
L局所記述子:、SIFT PCA-SIFT、GLOH、コンテキストの形状、ORB、COGE
2.2.2ベクトル化
視覚的な単語にL局所特徴(すなわち量子化された特徴、機能の量子化):変換イメージIDのための視覚的単語、局所的な特徴ベクトルを探します
lの量子化技術の共通の特徴:階層1-NN、KD-ツリー
Lは、視覚単語に基づいて画像を表します。
ローカル画像特徴視覚的な言葉、視覚単語ヒストグラムバッグ→
2.2.3インデックス
リットル転置インデックス
L分類:TF-IDF重み付け(用語頻度 - 逆文書頻度)
2.2.4治療
クエリ拡張L:より多くのクエリ用語を含む、オリジナルの局所的な特徴となるよう、そして拡張されたクエリ
他の後処理技術L:ローカル幾何検証(ローカル幾何学的検証)、量子化製品(製品量子化)
- 深さの学習と画像認識
3.1深学習開発プロセス
画像の分野におけるアプリケーションL深さ研究:画像検索、異常な腫瘍を同定、画像記述、着色画像
3.2なぜ深い学習を使用
リットル人間の脳の視覚メカニズム:1)感情の段階に応じて - 情報収集2)視覚の段階 - 認知情報
ニューラル1 - 中心 - 脳:吸気原信号(ピクセル) - 予備処理(エッジ方向) - 抽象(形状) - 抽象以上(具体的にはオブジェクト)
深い学習を使用する方法3.3
画像認識深学習ソリューションを使用する方法3.3.1
所望Lの機械学習(学習の深さ)を使用して:適切な機能を見つけること
3.3.2これらの手順を実行します。モデリング(人)、機能の喪失(人)、パラメータ学習(機械)
3.3.3モデル
L一般的な活性化機能:シグモイド、双曲線正接、ARCTAN、ReLU、PReLU
Lプレニューラルネットワーク:入力層、中間層→→出力層
例リットルモデル:AlexNet、VGG、GoogleNet、残留ネット
出力層L:出力層の関数としてソフトマックス活性化関数、よりよい計算さ理解しやすいです
Lは、適切なネットワーク構造を提供し:層の数、ノードの数、活性化関数を
3.3.4損失関数
一般的損失関数L:二次損失関数、クロスエントロピー損失関数
lの全損失:
3.3.5パラメータ学習
リットルの勾配降下:
リットルのバックプロパゲーション:連鎖法則
- 実践コース
lの顔認識