[デジタル画像処理] デジタル画像の基礎 -- デジタル画像処理をベースに

I.はじめに

        デジタル画像処理の基礎は、デジタル画像の取得に基づいています。ここでは主に、画像フォーマット、画像イメージング、画像の数学的特徴、画像の基本的な数学的処理など、画像のいくつかの基本的な概念を紹介します。

2. 画像認識の要素

        主に 2 つの部分: 色と明るさ

人間の目の画像処理:

        Iris : 瞳孔の直径を制御します。これは絞りに相当し、入る光の量を制御します。

        レンズ: レンズに相当し、理論的には、人間の目の結像距離をカスタマイズすると考えることができ、レンズの変形により焦点距離が変化し、異なる物体距離の結像を実現できます。

        網膜: 視細胞には錐体と桿体の 2 種類があります。このうち錐体は光軸上にある網膜の中心窩にあり、目が斜視になるとここでも回転します。各錐体は色を感知する神経終末に接続されており、画像は人間の目が焦点を合わせる場所です。桿体は網膜上に広く分布しており、いくつかの桿体が神経終末につながっており、色知覚を持たず、月明かりの下での視覚などの低照度に敏感であり、主に桿体が刺激される(理由は瞳孔の直径による)明るさの下では大きいため、レンズに入る光の範囲が広くなり、より多くの光が網膜のより広い範囲に伝達されます。このとき、錐体はより少ない光を受け取り、杆体はより多くの光を受け取ります)。      
        錐体細胞:錐体はS錐体、M錐体、L錐体に分けられる3種類の錐体細胞に分かれており、光の波長が異なると3種類の錐体細胞の活性度が異なります。そのとき初めて、色の生物学的感覚が生まれました。可視光の場合、分布は次のようになります。

L 錐体は赤に対してより敏感であり、M 錐体は緑に対してより敏感であり、S 錐体は青と紫に対してより敏感であることがわかります。太陽光の場合、さまざまな可視光が混合したものであるため、人間の目は太陽光を白色光と認識し、これがRBG三原色の原理にもなっています。白は物理的な色ではなく、白色光は存在せず、白は単なる生物の概念です。 

明るさとグレースケール:

        実際の物理的な意味では、明るさは光の強度を指しますが、グレー スケールは最小から最大までの明るさの離散的な間隔を指します。グレー スケールは相対的であり、相対的に変化します。最大の明るさと明るさによって決まります。離散間隔 間隔を決定します。人間の目は実際には明るさをダイナミック レンジとして認識しますが、理論的には人間の目が認識するのはグレー値です。輝度飽和に関しては、階調値は最大輝度を最大階調としているため、最終的に最大階調はこの輝度を超える最大階調となり、情報が失われます。

色:

 

        RGB: 人間の目の画像の以前の分析によると、赤、緑、青を 3 つの基本色として使用し、白を合成できると同時に、黄色、シアン、紫を合成できることがわかります。 2つのペアを組み合わせる

        反射型RGB:人間の目で見える光は、直接光(透明な物体を透過する光を含む)と、物体自体が発光せずにその光を反射する反射光の2種類に分けられます。ライト。直接光オブジェクトの場合、私たちが見る色はそれが発する光であり、色の合成は RNG の合成です。反射光物理学の場合、私たちが見る色はそれが反射する光であり、その色の合成は反射です。 RGB。白色光補助光を基準とします。たとえば、青色の補助光は黄色です。この時点で、フィルライトの三角形があります。

        さまざまな原色に基づいた他の色空間があります。

3. 画像のサンプリングと量子化

        光学センサーで画像を撮影した後、センシング画像を取得し、処理後にデジタル画像に変換します。デジタル画像は、次の 2 次元関数によってデータを定義しますy=f(x,y)ここで、y は (x, y) のグレー値を表します。x、yはその二次元画像面を離散的に分割する間隔を表します。

        画像解像度: 空間解像度と輝度解像度に分けられます。空間解像度とは画面をどの程度細かく分割するかを表し、例えば 10um*10um が 1 ピクセルを表し、これが空間解像度であり、解像度サイズは 10um であり、分割が細かくなるほどピクセルサイズは小さくなります。明るさの解像度はグレースケール値の分割を指し、256 の場合は最も明るい部分と最も暗い部分を 256 段階に分割することを意味し、128 の場合は比較的細かくなりません。グレースケール解像度が高くなるほど、明るさの表現がより細かくなります。

        画像のデジタル ストレージ グレー値は通常、次のとおりですL=2^{k}バイナリ表記に基づくと、各ピクセルは 1 バイトで表され、k は 8 で、表現できるグレー スケールの範囲は 0 ~ 255 です。2 バイトで表される場合、k は 16 で、0 ~ を表現できます。 255 の範囲は 65535 です。画像のサイズが M*N の場合、記憶サイズは M*N*k ビット、つまり m*N*k/8 バイトになります。

        dpi: インチあたりのピクセル数。dpi が大きいほど、画像の精度が高くなります。

4. 画像フォーマット

bmp (ビットマップ) 形式:

        ビットマップされたストレージ形式、選択可能な色解像度以外は圧縮なし、スキャン順序は左から右、上から下

JEPG(共同写真専門家グループ)

        非可逆圧縮は冗長な情報を削除するために使用され、圧縮率は比較的高くなりますが、画質をより良く維持できます。

Png(ポータブルネットワークグラフィックス)

        比較的小さなストレージ容量と高い圧縮率を備えたポータブルなグリッド ストレージ形式

tig(タグ画像ファイル形式)

        画像形式は比較的複雑で、あまり見られませんが、出版、スキャン、マッピングなどに使用されます。

5. 数学ツール

        確率と統計、線形代数、微積分、その他の知識など、いくつかの基本的な数学ツールが使用されます。

                        

おすすめ

転載: blog.csdn.net/weixin_43163656/article/details/127966732