バイナリ画像、グレースケール画像、カラー画像およびその他の関連知識の分類

実際、画像処理を学んだ後、基本的にバイナリ画像、グレースケール画像、カラー画像、画像のチャンネルと深さについては自分なりに理解していますが、実際のアプリケーションとなると、特にコードの観点から画像処理が実行される場合、概念の混乱は常に発生します。インターネットで特定の知識ポイントを検索して問題を解決する必要があるたびに、後で知識ポイントを忘れてしまいます。そこで、ここでは便宜上これらの知識ポイントを体系的に整理したいと思います。独自の理解システムを確立すると、結局のところ、書き留めた内容が常により印象的になります。

多くのデジタル画像処理関連の書籍では、これらの概念がいくつかの章で紹介されており、もちろん書籍内で紹介されている知識ポイントはより詳細に記載されていますが、結局は文章であり、入り口の角度が一貫していません。本の説明よりも、私はさまざまなフォーラムに行ってネチズンのこれらの概念の理解を確認することを好みます。今回は、シングルチャンネル画像、マルチチャンネル画像、バイナリ画像、グレースケール画像、RGB およびその他の関連ワードを Google に入力し、一般に csdn、short books、Zhihu などからの検索結果の最初の 10 件を選択しました。 . プラットフォームでは、知識ポイントを統合し、知識フレームワークを整理するために自分の言葉を使用します。

1. デジタル画像
画像は 2 次元関数f(x,y)として定義できます。ここで、xyは空間 (平面) 座標であり、任意の座標点( x,y )におけるfの振幅は、ポイントの明るさでの画像。グレースケールは白黒画像の明るさを表すために使用される用語ですが、カラー画像は個々の 2 次元画像を組み合わせて形成されます。たとえば、RGB 表色系では、カラー画像は 3 つの独立したコンポーネント画像 (赤、緑、青) で構成されます。したがって、白黒画像処理用に開発された多くの技術は、3 つの独立したコンポーネントを個別に処理することにより、カラー画像処理に適用できます。画像は、x 座標と y 座標および振幅に関して連続的です。このような画像をデジタル形式に変換するには、座標と振幅をデジタル化する必要があります。座標値を数値化することをサンプリングといい、振幅を数値化することを量子化といいます。したがって、x、y成分とfの振幅がすべて有限かつ離散量である場合、その画像はデジタル画像と呼ばれます。画像の本質: ピクセルで構成される 2 次元のマトリックス


2. 一般的な画像形式
bmp: 一般的ではない、可逆、基本的に圧縮なし、サイズが大きい
jpg (jpeg): より良い画質を得るために最小のディスク容量を使用しますpng:
可逆圧縮のビット画像形式
フレーム画像合成のアニメーション

3. 色深度
色深度は、色深度と呼ばれます。コンピュータ グラフィックスの分野では、ビットマップまたはビデオ フレーム バッファーに各ピクセルを格納するために使用されるビット数を意味します。一般的な単位はビット/ピクセル (bpp) です。色深度が高いほど、使用できる色が増えます。
簡単に言うと、色深度は各ピクセルが表示できる色の数を指します (これは表示できる色の数であることに注意してください。実際には、ピクセルごとに 1 つの色しか表示されません)。一般に「ビット」または「ビット」の単位で測定されます。ビット数が多いほど、使用できる色が増え、画像のカラー パフォーマンスはより正確になりますが、ビット深度が高い画像では各ピクセルにより多くの色情報が格納されるため、画像のファイル サイズもビット深度に応じて増加します。 。

4.「ビット」の説明
コンピュータは情報を2進数で処理・保存するため、コンピュータに入力される情報は1と0の異なる数字の組み合わせとなり、色も同様です。
例えば、コンピュータでは色深度1ビットは0か1しか表示できないため、表示できる色情報は白か黒の2種類だけです。色深度を 2 ビットに増やすと、00、01、10、11、4 (2^2) の組み合わせになり、比較的単純な黒、白、グレーの関係になります。色深度が 3 ビットに達すると、000、001、010、011、100、101、110、111 の 8 つの異なる組み合わせが得られ、黒、白、グレーの間の遷移がより詳細になります。桁数が増加するたびに、組み合わせ方法により 2 倍の増加が得られることがわかります。もちろん、ここでは白黒画像について話しています

5. 画像チャネル
シングルチャネル: グレースケール画像とも呼ばれ、各ピクセルは 1 つの値のみを持ち、画像深度が 8 ビットの場合、ピクセル値は 0 (黒) ~ 255 (白) で、3 つのチャネル:
つまり, 見られるカラー マップを通じて、各ピクセルは 3 つの値で表されます。画像深度が 8 ビットの場合、ピクセル値は赤、緑、青を表すために重ね合わされ、各値は (0 ~ 255) です。4 つのチャネル
: 3 チャンネルの画像を基に透明度を追加することになりますが、透明度チャンネルでは、画像深度が 8bit の場合、0 は完全に透明、255 は完全に不透明になります。

6. バイナリ画像
バイナリ画像とは、各ピクセルが黒または白である画像を指します。定義により、各ピクセルが 2 つの値 (黒と白) のみを持つ画像を指します。画像の可能な値またはグレースケール状態は 2 つだけです。
ビット深度が 1 の場合、バイナリ イメージの各ピクセルには 0 と 1 の 2 つの値しかありません。0 は黒を意味し、1 は白を意味します。そのため、バイナリ イメージは通常次のようになります。
ここに画像の説明を挿入
2 つの値なので、各ピクセルは 1 ビットのみを保存する必要があります。
グレースケール画像では、画像のバイナリ画像は画像のグレースケール値を 0 または 255 に設定します。つまり、画像全体を白黒の視覚効果のみで表示します。

7. グレースケール イメージ (単一チャネル イメージ、白黒イメージ)
グレースケール イメージ。グレースケール イメージとも呼ばれます。白と黒の間の対数関係は、グレー スケールと呼ばれるいくつかのレベルに分割されます。グレースケールで表現された画像をグレースケール画像と呼びます。私たちが一般にグレースケール画像と呼ぶものは、一般に単一チャネル画像です ( 3 チャネル画像の値が同じである場合、画像はグレースケール画像と同じに見えますが、本質的にグレースケール画像とは異なります)つまり、3 チャネルの画像はグレースケール画像のように見えますが、単一チャネルの画像はグレースケール画像にしかなり得ません)、1 ビットの記憶空間しかないバイナリ画像と比較すると、単一チャネルのグレースケール画像は次のように表されます。 8 ビットのグレースケール値 (0 ~ 255) を通じて単一のピクセルごとに、各ピクセルの値の範囲は [0 ~ 255] です。バイナリ画像とは異なり、グレースケール画像には白と黒だけでなくさまざまなグレーが含まれており、合計 256 レベルに分割されています。たとえば、500*500 ピクセルの単一チャネル グレースケール イメージは、異なるグレースケールの 500X500=250,000 ピクセルで構成されます。(実際、バイナリ画像はグレースケール画像の一種であることが理解できますが、そのピクセル値は白と黒のみです。バイナリ画像の最小要件は 2 ビットのストレージですが、ピクセル値は8 ビット グレースケール画像では 0 と255 のみを使用し、バイナリ画像の効果も実現できます。 )
グレースケール画像は次のとおりです:
ここに画像の説明を挿入
8. カラー画像 (RGB 画像、3 チャンネル画像)
カラー画像は通常合成されます。複数の重ね合わされたカラー チャネルで構成され、各チャネルは特定のチャネル値を表します。画像処理で言うカラー画像とは一般にRGB画像のことを指しますが、グレー画像と比べるとシングルチャンネル画像、つまり各ピクセルに1つの成分しかなく、RGBの各ピクセルに3つの成分があります(また、 3 チャネルと呼ばれます) は、赤、緑、青の個別の原色コンポーネントで構成されます。したがって、RGB を使用してカラー画像を表現できます。グレースケール画像と比較して、RGB には追加の色情報があります。
GRB イメージを以下に示します。
ここに画像の説明を挿入
下の図は、完全な RGB カラー イメージのカラー チャネル分割の例を示しています。左の列は自然色の分離されたカラー チャネルを示し、右の図はそれらのグレースケールに相当するものを示しています
ここに画像の説明を挿入
9. ベクターグラフィックス
バイナリ イメージ、グレースケール イメージ、および RGB イメージはすべてビットマップと呼ばれ、行列の形式で保存されます。行列の行と列によって画像のサイズが決まり、ベクトルに保存される行とブロックの情報が決まります。グラフィックス、つまりベクター グラフィックス ファイルと解像度 レートは画像のサイズとは関係なく、画像の複雑さと、画像ファイルが占めるストレージ容量が小さいことのみに関係します。
ベクター グラフィックスの利点は次のとおりです。
· 画像は無限に拡大縮小でき、グラフィックスのズーム、回転、変形時にギザギザの効果が発生しません。
高解像度の印刷が可能であり、ベクター グラフィック ファイルは、印刷または印刷に最高の解像度を備えた任意の出力デバイス プリンターで印刷および出力できます。ベクター グラフィックはぼやけることなく無限に拡大されますが、ビットマップは拡大するにつれてぼやけます

おすすめ

転載: blog.csdn.net/weixin_43352502/article/details/128979737