豚モジュール部門:
まず、下の図のいくつかの概念をオフにします。
画像:画像全体、フォームを獲得:青色部とブロック:赤セクション;細胞:赤い部分の4グリーン部と
Dalal豚特徴抽出プロセスが提案されている:サンプル画像を画素単位(セル)に分割され、平均勾配方向は9つのセクション(ビン)内の各セル内の全ての画素の各方向の勾配方向に分割されています9次元の特徴ベクトルを与える間隔ヒストグラム統計、4つの隣接セルのそれぞれは、ブロックのサンプル画像を用いて、一つのブロック(ブロック)、36次元の特徴ベクトルを与えるために一緒に連結されたブロック内の特徴ベクトルを構成しますユニットとしてスキャンステップサイズ、スキャン。最後に、機能ブロックは、すべて一緒に、と体の特性を取得します。各セルは、9つの特徴を有するため、例えば、128×64の画像に対して、8×8画素の各セルから成る、2×2ブロックからなる各セルは、それが各ブロック内にある4×9 = 36項、8つの画素、次いで7つの水平方向走査ウィンドウのステップにおいて、垂直方向の走査ウィンドウ15が存在することになります。すなわち、64×128画像、36 * 15 * 7 = 3780の特徴の合計です。
HOGの寸法、構成16×16画素ブロック、8×8画素セル
私たちは、豚が達成スライドフレームの使用は、その後、コンセプトにつながることを知っている:ステップ;圏ステップを、ステップに勝つ、ビンのセル。
一般的に、勝利は、最上位の特徴量演算部であり、それは、対応するターゲットのすべてのパラメータの勝利です。
勝利より一般的に少ないブロック、幅とブロックの高さを獲得し、典型的には幅と高さの整数倍であるため、ブロックがステップ勝利を横断しているとき、ブロック、ピクセル数スライド。
参考のために販売のサイズによるブロックサイズ;細胞をスライドしない(図:HOG特徴計算)
ビンのセルは、それが何を意味するのでしょうか?
以前、我々は勾配を研究し、勾配は、勾配の大きさ及び方向を含む、各画素で算出され、方向ビンれる約。
0-360は、円はすべて40度、9の合計を分割円であり、これは、ビンである分割毎に40度;・ビン= 40度(図:HOG特徴計算)
360度情報を含むように、細胞は、わずか9ビンです。
我々はハールに述べたように、特徴値(白 - 黒)が得られる;および豚は、ベクトル(ベクトル寸法)を得る工程;
寸法=ブロック番号*豚*のビンにおける細胞の細胞数の数。
勝利が公式サイズ64×128をお勧めし、16×16画素ブロックが構成され、8×8画素セルを、8つの画素のブロックステップサイズ、ブロック数=((64-16)/ 8 + 1)×(128- 16)/ 8 + 1)= 105ブロック。
ブロック= 4番目のセル(16 * 16 = 2 *(8 * 8));及びcell1,2,3,4。
HOG寸法= 105 * 4 * 9 = 3780。
勾配述べたように、我々は豚のGETは豚の勾配が、それを計算する方法を、次に、ベクトルであることを知っていますか?
ハーは、フィーチャテンプレートを使用するのと同様の方法で算出しました。
テンプレートレベル:[0 1 -1]、垂直テンプレート:[1] [0] [-1]。
テンプレートと、対応する画素の製品。
勾配の大きさ√=(2 + B 2)、角度=アークタンジェント(/ B)
言及した勾配は、勾配が画素に基づいて、各画素が勾配を有し、勾配計算が知って、それを計算する方法をそのビン突起
0〜360度以上に述べたように、円はすべて40度、9の合計を分割し、円であり、これはビンである40度のそれぞれの分割;・ビン= 40度(図:ブタ特性計算)
;各ビンサイズの0-40は、それが投影された2つのビンが属する0~40度である、連続していないビンのみ0-20、20-40の連続したブロックで連続しています。
そして、BIN1:0-20、180〜200;両方のブロックは、投影ビンに属し、次のとおりです。
画素I、Jのために、Fの勾配の大きさ、角度です。
= 10の場合、それはBIN1に投影される。= 190ならば、それはまたBIN1に投影されます
これをfの大きさと計算される方法:
方法1(参照:HOGは原則特徴)します。https://blog.csdn.net/q1007729991/article/details/53032776
方法2:参照:HOG特徴ます。https://www.zhihu.com/collection/282778463
HOG特徴量を要約すると:
HOG特徴:
使用した勾配方向ヒストグラム(指向勾配のヒストグラム、HOG)は、コンピュータビジョン及び画像処理記述子で検出されたオブジェクトの特徴です。それは、勾配方向ヒストグラム及び局所領域の画像の統計的計算により構成されていることを特徴とします。豚SVM分類器結合特性が広く、画像認識において使用されている特定の歩行者検出は、大きな成功を得ました。
HOG特徴抽出方法は、画像(検出されるべきターゲットまたは走査ウインドウ)です。
1)階調)を3次元画像の(X、Y、Z(階調として見られる画像)の。
2)ガンマ)(正規化された規格化入力画像の色空間を用いた補正方法であって、画像のコントラストを調整する目的、及び照明シェーディングの影響を低減するには、画像の局所的な変化を引き起こし、ノイズ干渉を抑制することができます。
主輪郭情報をキャプチャするために、干渉光のさらなる弱体化; 3)大きさおよび方向を含む各画素()のための勾配画像を計算します。
4)画像は小さな細胞(例えば6×6画素/セル)に分割されています。
5)各セル(異なる勾配の数)、各セルの記述子を形成するための勾配ヒストグラム統計。
6)セルブロックの組成毎にいくつかの(例えば、3×3セル/ブロック)は、すべてのセルブロック内の特徴記述子は、直列に接続されているブロックのHOG特徴記述を与えます。
7)シリーズのイメージ画像記述子内のすべてのHOGブロックを特色にするあなたはHOG特徴記述子を検出したい画像(ターゲット)を得ることができます。
下面这篇文章一定需要好好看看:opencv源码解析之(6):hog源码分析
参考:OpenCV+TensorFlow 入门人工智能图像处理
Hog特征提取 openCV:这篇文章中开头参考的大神讲的好;