画像処理ノート(OpenCV)
序文
データ構造の第5章を書いたとき、配列について話したとき、データ構造の第5章の内容は画像処理に関連する二次元配列圧縮であるため、画像処理についてのメモを書きたいと思いました。
たまたま、3年生のときにまだ画像処理のメモが見つかったので、Wordで書いたメモをブログに移行しました。私のブログの知識セクションを補足します。
この時期にブログノートを書いていると、マインドマップとブログにはそれぞれメリットがあり、組み合わせる必要があることに気づきました。シンプルなマインドマップは理解しづらく、シンプルなドキュメントは全体を理解するのに不便です。
将来的には、効率が許せば、マインドマップを使用して思考構造を紹介し、写真を使用して重要な視点を示し、表を使用して比較し、記事を使用して内容を伝えます。
効率が許されない場合でも、それは純粋なマインドマップとテキストです。結局のところ、タイプ設定とフォアシャドウイングには多くのエネルギーが必要です。
記事ディレクトリ
ノート
第1章はじめに
1.画像処理アプリケーション:顔認識、ライセンスプレート認識、歩行者認識、ジェスチャー認識、指紋認識、虹彩認識、動き認識
2.画像処理の分野:日常生活、映画およびテレビの娯楽産業、軍事分野、赤外線画像、医療画像、コンピュータービジョン
第2章画像のデジタル化
\ 1.画像のデジタル化:アナログ画像が離散化された後の画像のデジタル表現を指します。これには、空間離散化(つまりサンプリング)と明暗表現データの離散化(つまり量子化)が含まれます。
\ 2.サンプリング:空間的に連続した画像を個別のサンプリングポイント(ピクセル)のセットに変換する操作を指します。画像は二次元的に分布した情報であるため、サンプリングはx軸方向とy軸方向の両方で実行されます。一般に、x軸方向とy軸方向のサンプリング間隔は同じです。
\ 3.解像度:画像平面上の単一のピクセルにマップされたシーン要素のサイズを指します。
単位:ピクセル/インチ、ピクセル/ cm(例:スキャナーインデックス300dpi)
単位:ピクセル(例:デジタルカメラインデックス300,000ピクセル(640 480))
\ 4.サンプリング間隔:サンプリング間隔が小さすぎるとデータ量が増えます。大きすぎると情報がエイリアス化され、詳細(モザイクなど)が認識できなくなります。
\ 5.量子化:各ピクセルに含まれる明暗情報を離散化した後、数字で表されます。一般的な量子化値は整数です。人間の目の認識能力を十分に考慮した後、現在の非専用画像はすべて8ビットの量子化です。つまり、0〜255の整数を使用して「黒から白」を表します。3ビット未満の量子化、誤った輪郭現象が表示されます;ポスター描画; 2レベルのグレースケールは2値化です
6.デジタル画像の説明:画像を数値で表現する方法を指します。デジタル画像は画像のデジタル表現であり、ピクセルはその最小単位です。マトリックスは2次元であるため、デジタル画像の記述に使用できます。現在、デジタル画像を記述するマトリックスは、整数マトリックス、つまり、整数で表される各ピクセルの明るさを使用しています。
7.グレースケール画像は、量子化されたグレーレベルによる各ピクセルの画像情報であり、色情報はありません。
8.カラー画像とは、各ピクセルの情報がRGBの3つの主要な色で構成されている画像のことで、RGBはさまざまなグレーレベルで表されます。カラー画像は1つのマトリックスで説明することはできません。通常、3つのマトリックスを使用して同時に説明します。
9. **ビットマップファイルの全体的な構造:**ファイルヘッダー、情報ヘッダー、トゥルーカラーモード(ピクセルのRGB値)、インデックスカラーモード(パレット+カラーインデックス値);灰色の反転は悪影響です。
第3章バイナリ画像処理
1.バイナリ画像処理の問題:抽出されたターゲットに誤ったターゲットがあり、複数のターゲットに接着または破損があり、複数のターゲットの形状が異なります。
2.接続:4つの接続と8つの接続があります(現在のピクセルは黒で、隣接する8つのピクセルの少なくとも1つは黒です)。
3.接続ドメイン:相互に接続された黒いピクセルの集合は、接続ドメインと呼ばれます。
4.バイナリ画像の分析方法:ラベリング、腐食、膨張、開操作、閉操作、間引き方法
5.ラベリング:
6.腐食:接続されたドメインの境界点を削除し、境界を内側に縮小するプロセスです。腐食処理は、互いにくっついているさまざまなオブジェクトを分離し、小さな粒子のノイズを取り除くことができます。
7.拡張:ターゲット領域の背景ポイントをターゲットにマージし、ターゲットの境界を外側に拡張するプロセスです。
8.開閉操作の提案:バックグラウンドで導入された膨張および腐食操作は、ターゲットの後処理に非常に良い効果をもたらします。ただし、腐食と膨張の計算の欠点の1つは、元のターゲットのサイズが変わることです。この問題を解決するために、腐食と膨張は逆の操作のペアであることを考慮して、膨張と腐食の操作は同時に実行されます。これは、オープン操作とクローズ操作を構成します。
9.オープン操作:最初に元の画像に対して腐食処理が実行され、次に拡張処理が実行されます。オープン操作は、基本的に、付着したターゲットを分離しながら、元のターゲットのサイズを維持できます。
10.閉じる操作:最初に元の画像を拡大してから、腐食します。クローズ操作では、基本的に、壊れたターゲットをマージしながら、元のターゲットのサイズを維持できます。
\ 11.間引きプロセス:画像のスケルトンを見つけるプロセス。間引きプロセスの後、画像内のすべての線の振幅は1ピクセルになります。
第4章カラー画像処理
色レベル補正、画像の平滑化とフィルタリング、画像の鮮明化処理などの方法と、色補正やカラーバランスなどの方法について説明します。
第5章画像ノイズ抑制
1.いわゆるイメージノイズは、イメージが撮影または送信されるときに受信されるランダムな干渉信号です。一般的なものは、ソルトアンドペッパーノイズとガウスノイズです。
2.ソルトアンドペッパーノイズの特性:場所はランダムですが、ノイズの振幅は基本的に同じです。
ガウスノイズの特徴:特定の位置(各ポイント)に現れますが、ノイズの振幅はランダムです。
3.画像ノイズ抑制方法:平均フィルター、中央フィルター、境界保存フィルター
4.平均フィルター:画像上で、処理されるピクセルには、その周囲の隣接するピクセルを含むテンプレートが与えられます。元のピクセル値をテンプレート内のすべてのピクセルの平均値に置き換える方法。平均フィルターの欠点は、すべてのポイントを均等に処理するため、画像がぼやけることです。ノイズポイントを配分すると同時に、シーンの境界ポイントも配分します。
5.メディアンフィルター:ノイズ(ソルトアンドペッパーノイズなど)のため、この時点のピクセルは周囲のピクセルよりもはるかに明るく(暗く)なります。
特定のテンプレートで、ピクセルが小さいものから大きいものに再配置される場合、最も明るい点または最も暗い点を両側に配置する必要があります。処理するピクセルの値(現在の位置)をテンプレートの中央の位置にあるピクセルのグレー値に置き換えることで、ノイズをフィルタリングする目的を達成できます。
\ 6.境界保存フィルターの中核は、境界点と非境界点を決定することです。
第6章画像の強調
1.画像エンハンスメントとは、一連のテクノロジーを使用して、画像の視覚効果を改善したり、画像を人間または機械の分析および処理により適した形式に変換したりすることです。
2.強調の範囲から始めて、画像強調方法は、空間領域強調と周波数領域強調に分けることができます。
空間ドメインの拡張は、画像の各ピクセルを直接処理することです。
周波数領域の拡張は、フーリエ変換後に画像のスペクトル成分を処理し、次に逆フーリエ変換して目的の画像を取得することです。
3.線形コントラストストレッチ:強調された懸念から人間の部分に拡大するための明暗の違い(つまり、コントラスト)による。
4.グレーレベルウィンドウ:実際には、線形コントラストの広がりの特殊な形式。興味深い部分だけが保持され、残りは0に設定されます。
5.線形ダイナミックレンジ調整:ダイナミックレンジを圧縮することにより、当該部品のグレースケール変化範囲を拡大することができます。
6.非線形動的範囲調整:線形動的範囲調整のピースごとの線形マッピングが十分にスムーズではないため。
- 対数変換:明るい部分を抑制しながら暗い部分を拡大します。全体的に明るい
- 指数関数的変換:全体的に暗くなる。
- 権力法の変革:自由な調整
7.ヒストグラムの等化
第7章画像の幾何学的変換
画像の幾何学的変換には、画像の形状変換と位置変換が含まれます。
画像の形状変換とは、画像の拡大、縮小、およびミスカットを指します。
画像の位置変換とは、画像の平行移動、ミラーリング、回転を指します。
第8章画像の鮮明化
画像の鮮明化の目的は、画像内のシーンの詳細なエッジと輪郭を強調することです。シャープニングの役割は、グレースケールのコントラストを高めることです。
エッジと輪郭がグレーレベルが突然変化する場所にあるためです。したがって、シャープニングアルゴリズムの実現は、差動アクションに基づいています。
第9章画像変換
画像の数学的変換の特徴は、多くの画像処理技術の基礎である正確な数学的背景にあります。これらの変換のうち、1つは空間領域で実行されます。もう1つの重要な数学的変換は、元々画像空間で定義された画像を何らかの形で他の空間(周波数領域)に変換し、これらの空間で入力画像の固有のプロパティを使用して、画像を効率的かつ迅速に処理することです。分析。
最も一般的な変換は、離散フーリエ変換、ガボール変換、ウェーブレット変換、離散余弦変換、KL変換などです。
空間領域での数学的変換であろうと、周波数領域での数学的変換であろうと、画像分析、フィルタリング、エンハンスメント、圧縮、その他の処理において非常に典型的で重要なアプリケーションがあります。
第10章画像コーディング
データコーディングの研究内容には、データの表現、送信、変換、コーディングの方法が含まれます。目的は、データの保存に必要なスペースと送信に使用される時間を削減することです。
画像のコーディングと圧縮は、特定のルールに従って画像データを変換および結合し、できるだけ少ないコード(シンボル)でできるだけ多くの画像情報を表現することです。bmp jpeg psd
OpenCVの概要
総括する
今日は、知識を確認し、データ構造内の配列のアプリケーションケースについて話し合ったため、このグラフ処理ノートを作成しました。
その後、ビデオコーディング、特に画像処理の応用について学びます。デジタルフィルムとテレビ技術の基礎のレビューを書いたときにビデオ変換とデジタルビデオの基礎について述べましたが、内容が多すぎて拡張されなかったので、ビデオ変換とデジタルビデオの基礎のいくつかの概念を書きます。
更新アドレス:GitHub