コンピュータビジョンNo.1。画像の前処理



1.色空間

  • RGBはより重ね合わされ、より明るくなります(通常はコンピューターのディスプレイに使用されます)
  • CMYはより重ね合わされ、より黒くなります(通常は印刷に使用されます)

ここに画像の説明を挿入
ここに画像の説明を挿入


グレースケール画像の変換式:
ここに画像の説明を挿入


2.ヒストグラム均等化

画像を非線形に引き伸ばします。各グレースケール単位のピクセル数を再配分することは、一般に、白すぎるか暗すぎると撮影された写真全体に対して行われます。部分的な暗さやボリュームであれば問題ありません。適応ヒストグラムを使用できます。


3.形態

ここに画像の説明を挿入


ここに画像の説明を挿入


4.フィルタリング/畳み込み

異なる関数は異なる関数を定義する必要があります

  • スムージング、ノイズ除去
  • グラデーション、シャープ
  • エッジ、突出点、テクスチャ
  • パターン検出

4.1フィルタリング前の充填

サイズを変更しないようにするには、フィルタリング前の充填操作を行います。

  • ゼロパディング
  • 境界コピー
  • 鏡像
  • ブロックコピー

具体的な効果は次のとおりです
ここに画像の説明を挿入
ここに画像の説明を挿入
。現時点では、ゼロパディング方式を最も使用する必要があります。



4.2いくつかの古典的なフィルター

  • 平均フィルタリング:一般的にあまり使用されません。つまり、ノイズを除去することも、特徴をうまく抽出することもできません。

  • メディアンフィルタリング:一般的にノイズ除去に使用されます。

  • Gaussian Wave Recorder:携帯電話のカメラの背景ぼかし機能と同様に、周囲をぼかします。(主な機能はガウスピラミッドを構築することです)

  • 勾配検出用のプレウィットフィルター:


ここに画像の説明を挿入

ここに画像の説明を挿入


4.2.1ラプラシアン算子

勾配を見つける上記の方法は、一次導関数の勾配と同等であり、ラプラシアン演算子は二次導関数です。彼のすべての畳み込みと合計はゼロに等しいことに注意してください。


ここに画像の説明を挿入

ラプラシアン演算子は、合計が0に等しいため、画像が非常に均一である場合は0です。特定のピクセルがより目立つ場合、最終的なフィルタリング結果がより目立つようになり、シャープネスを実現できます。以下は彼のレンダリングです。

ここに画像の説明を挿入
さらに、シャープ効果を実現するためのシンプルなフィルターがあります。

ここに画像の説明を挿入




5.画像ピラミッド

2つの一般的なイメージピラミッドがあります。1つはガウスピラミッドで、もう1つはラプラシアンピラミッドです。

5.1ガウスピラミッド

通常の画像を直接ダウンサンプリングすると、多くの詳細が失われます。最初にガウスフィルタリングを通過させ、次にガウスフィルタリングの後に画像をダウンサンプリングすると、結果の画像がより鮮明になります。次の図に示すように、ガウスフィルタリングの方法で形成された画像ピラミッドはガウスピラミッドです。

ここに画像の説明を挿入



5.2ラプラスピラミッド

Laplacian Pyramidの目的は、ガウスピラミッドのダウンサンプリングが完了した後、欠落している部分を補い、次にアップサンプリングの復元を実行することです。率直に言って、彼は違いです。

ここに画像の説明を挿入


ここに画像の説明を挿入



余談

1.フィルターが一般的に対称なのはなぜですか?

実際、主な目的は計算の複雑さを軽減することです。

ここに画像の説明を挿入



2.カーテン

Jiang Weiは次元を減らしてから、重要性の低いデータをいくつか削除します。

おすすめ

転載: blog.csdn.net/zhaozhao236/article/details/109485311