画像の色補正のいくつかの方法

さまざまな教育ビデオまたはドキュメント+ QQ:635992897

注:この記事は主に「カラーフェイス画像の色補正と肝疾患の診断への応用」という修士論文に言及しています。

       採取した画像の色は、採取環境との関係が大きく、同じサンプルで採取した画像の色が異なるため、サンプル間の比較に影響するため、採取した
サンプルの色補正行う必要があります。 。私たちが使用する色補正アルゴリズムは、監視のアイデアに基づいています。つまり、標準色による画像の色補正、現在の方向の色補正には、すでに多くの方法があります。これ
は、多項式回帰アルゴリズムベースの監視の主なアイデアである人工的なものです。ニューラルネットワーク、SVR法、いくつかのアルゴリズムには長所と短所があり、質問は実際のパラメータ設定に基づく必要があります。多項式回帰計算
強調法はアイテムの数と多項式形式を設定することです。人工ニューラルネットワークアルゴリズムはニューロンを設定する必要があります。 SVRアルゴリズムでは、エラーペナルティの重み、カーネル関数の形式とパラメータ、許容エラー範囲
、およびその他のパラメータを設定する必要があります。パラメータ設定が異なると、補正結果に直接影響します。したがって、パラメータ設定はさまざまなアルゴリズムの焦点であり、この章でも説明します。フォーカス。また、この章では、新しい色補正基準についても提案します。
この基準では、補正アルゴリズムを早期に終了して最適な補正結果を得ることができ、さまざまな補正アルゴリズムの長所と短所を基準に従って評価し、色補正アルゴリズムを選択します。最適なアルゴリズム。これらの
アルゴリズムについては、以下で詳しく説明し、顔の画像の色補正に使用し、評価基準に応じて最適な補正アルゴリズムを選択します。

        1.多項式回帰

多項式回帰アルゴリズムは、主にプリンターの色補正に使用され、必要なストレージスペースが少なく、計算速度が速く、実装が簡単です。多項式回帰アルゴリズムの重要なテクノロジーは、多項式の組み合わせを選択することです。項
が多いほど回帰効果が高くなるのではなく、実際の状況に基づいて合理的に選択します。

多重線形回帰に基づく色補正の原理を簡単に説明しましょう
。比色プレートにN個のカラーパッチがあるとします。i番目のカラーパッチの色の三刺激値は、標準空間および
自然光環境でのRoi、G0i、B0iです。以下に収集される、補正される比色プレート上のi番目のカラーパッチの三刺激値は、Ri、Gi、Biです。ここで、i = 1,2,3 ....... Nの場合、次のようになります。

 

その中で、Vji(j = 1、...、J)は多項式で構成されており、V = [R、G、B、1]、V = [R、G、B、RG、など、さまざまな多項式形式があります。 RB、GB、1]、V = [R、G、B、RGB、
1]など。Vの形式は、必要に応じてさまざまな形式に組み合わせることができます。 
式2-1の行列形式は次のとおりです。

それらの中で:Xは次元3×Iのカラースケール標準三刺激値マトリックスです

Aは寸法J×3の変換係数行列です。

Vは、次元J×Iの多項式回帰行列です。

行列Aは最小二乗法で最適化でき、Aは求めるモデルパラメーターです。

したがって、Aを式2-4に代入することにより、補正された画像の各ピクセルのR、G、およびBの値を計算でき、オンラインの色補正を実現できます。その中で、Xoutは、補正された画像のR、G、およびBの三刺激値マトリックスであり、寸法
は3×Mです。は、元の画像のすべてのピクセルのR、G、およびB値に対応する多項式項で構成されるマトリックスであり、寸法は次のとおりです。 J×M、Mは元の画像の総ピクセル数です。

多項式回帰アルゴリズムの鍵は、合理的な形式の多項式項を設計することです。色補正実験では、比較実験用に2セットのAB項を設計しました。グループAにはR、G、B値のさまざまな組み合わせしかなく、
グループBはグループAに基づいて定数項「1」を追加します。目的は、定数項「1」が結果にどのような影響を与えるかを確認し、より良い結果が得られるグループを選択し、最後に2セットの実験のすべての値を組み合わせてキャリブレーションを見つけることです。

一番よく効くアイテム。グループAのアイテムは次のように設計されています。

グループBのアイテムは、グループAのアイテムの後の定数アイテム「1」です。セクション2.4.2の実験は、グループAの効果がグループBの効果よりも高く、補正項の最適な数がグループAの9項多項式であることを示しています。

2.後方伝搬ネットワーク

     ニューラルネットワークは、人間の脳細胞の構造と機能を記述およびシミュレートするために使用される物理的に実現可能なシステムであり、フィードフォワード人工神経ネットワーク、人工神経ネットワークフィードバック、自己組織化競争力のある人間
神経ネットワークおよびランダム神経ネットワークに構造化されていますその中で最も広く使われているのは、フィードバック型の人工神経ネットワークであり、後方伝播ネットワーク、略してBPネットワークです。

     基本的な考え方は、エラー信号の順方向伝搬と逆方向伝搬によるBPアルゴリズム学習プロセスのプロセスは、入力サンプルの順方向伝搬から始まり
、必要な出力が得られ場合、各隠れ層から出力層への入力層を通過するというものです。出力が要件を満たしていないか、要件を満たしていない場合、エラー逆伝播プロセスが開始されます。逆伝播は、出力層から非表示層を経由して、最後に入力層に出力エラーを渡すことです。エラーは、各層の
すべてのユニットに割り当てられます。必要なエラー信号は、各ユニットの重量を修正することです。
     BPネットワークの構造を図2-1に示します。これは最も単純なBPネットワーク構造であり、入力前に1つの入力層、1つの隠れ層、1つの出力層があり、各層には3つのニューロン、合計9つのニューロンがあります。
エラーが戻って伝播され、エラーが戻って伝播されます。
      以下では、実験で使用する必要のある関数を簡単に紹介します。まず、最も一般的に使用される3つの励起関数
、ステップ関数hardlim(x)、線形伝達関数purelin(x)、対数シグモイド関数logsig(x)、および
接線を見てください。シグモイド関数tansig(x)を図2-2に示します。

BPネットワークはWidrow-Hoff学習アルゴリズムと非線形の微分可能な転送関数の多層ネットワークを使用します。典型的なBPネットワークは勾配降下アルゴリズムを使用します。
BPネットワークに基づく色補正アルゴリズムの特定のプロセスは、トレーニングフェーズとテストフェーズに分けられます。

1)トレーニングフェーズで
は、トレーニング用のカラーカードのカラーブロック値を使用し、入力として修正するカラーカード画像からRGB値を抽出し、カラーカードの標準値を確認します(カラーカード製造会社が標準カラーブロック値を提供します) 、
監視値はカラーカードの基準値を使用します。各カラーカード画像には24のカラーブロックがあります。つまり、BPネットワークの入力サンプルの総数は24で、各サンプルにはR、G、B、3つの入力値があり、隠れ層の後、最終出力も3つの
値になります。 、BP補正の結果として、カラーブロックの標準値と比較し、誤差を計算してから逆伝播し、各層の重量を補正してから、入力層からデータを入力し、隠れ層を通過して出力層
に到達し、最後まで誤差を計算します。標準では、トレーニングフェーズは終了し、トレーニングされたBPネットワークは、各レイヤー接続ラインと各ニューロン励起関数の重みです。

2)テストフェーズ
トレーニングフェーズでトレーニングされたBPネットワークを使用して、修正される顔画像の各ピクセル値が計算のためにネットワークに取り込まれます。各ピクセルのR、G、およびB値は入力であり、出力はピクセルの修正された画像です。
顔写真のすべてのピクセル値がBPネットワークによって計算された後、修正された顔写真は、BPネットワークの出力値で構成される新しい画像になります。
BPアルゴリズムは、matlab7.5のニューラルネットワークツールボックスを使用します。初期値、励起関数、各レイヤーのニューロン数、エラー伝播基準、重み学習基準、終了基準など、設定する必要のある多くのパラメーターがあります。
これらは結果に影響します。パラメータ設定は次のとおりです。

(1)
入力データ量が少なく、サンプル数が24個、入力が単純​​、各サンプルが3次元しかないため、必要なネットワーク構造も非常に単純であるため、ネットワーク構造も非常に単純です。そうしないと、オーバーフィットします。このラボでは、単一の
補正結果によると、隠れ層ネットワーク構造、入力ニューロン3、出力ニューロン3、隠れ層ニューロンの数試行3、4、5、6、7、8、9、10、11、12、13どちらが最適ですか。
(2)活性化関数
隠れ層は接線シグモイド関数tan-sigmoidを使用し、出力層は線形伝達関数purelinを使用します。
(3)データ処理
入力データは、matlabニューラルネットワークツールボックス関数newffのデフォルトの処理方法を採用します。つまり、fixunkonwns、removeconstractrows、mapminmax、出力データ処理方法:
removeconstractrows、mapminmax、グループ化はデータトレーニング中のランダムなグループ化です。
(4)重みとバイアスの
初期化方法の選択は、アクティベーション関数によって異なります.initnwは通常、曲線関数としてアクティベーション関数に使用されます.NguyenとWidrow [NgWi90]に従って、レイヤーの初期の重みとバイアス値を生成します。レイヤー
ニューロンのアクティブエリアは、入力スペースにほぼフラットに分散できます。initwbで使用されるアクティベーション関数は線形関数であり、通常はrandに設定され、-1から1の間のランダムな値を持ちます。アクティベーション関数によると、tansigと
purelinであるため、初期化方法は次のとおりです。第1層のinitnw、第2層のintwb、rands。
(5)トレーニング方法
バッチ処理方法、Levenberg-Marquardt最適基準に従って重みとバイアスを更新します。
(6)学習率
運動量駆動勾配降下法learngdmを使用すると、より速い収束速度を提供できます。運動量勾配降下法は、エラーサーフェスの現在の勾配と最近の傾向応答を包括的に考慮し、重み
最後の重み変更部分とアルゴリズムルールによって取得された新しい変更の合計と同じにすることによってネットワーク学習に重み追加します。
(7)終了条件

最大サイクル数は200、最大誤差は0.01です。

3.ベクトル回帰をサポート

SVMアルゴリズムは、近年、小さなサンプル、非線形、高次元のパターン認識の問題を解決する上で多くの利点があり、さまざまな分野でますます使用されています。SVMTongueYan
色補正のアイデアを最初に使用したZhangHongzhi以上の点で非常に良い結果が得られており、多項式回帰と比較して大きなメリットがあります。

サポートベクターマシンは、VCディメンション理論と構造的リスク最小化の原則に基づいており、予想されるエラーを最小限に抑え、最良の分類結果を実現します。SVM法は、線形分離可能性の場合の最適な分類面から提案され
ます。サポートベクターマシンのアイデア:最初に入力スペースを非線形変換によって高次元スペースに変換し、次に図2-3に示すように、この新しいスペースで最適な線形分類サーフェスを見つけます。サポートベクトル回帰は
、サポートベクトルマシンの回帰モデルであり、統計データに従ってデータ分布に適合します。

サポートベクターマシンの解決プロセスを以下に簡単に紹介します。
内部積K(x、x)を使用して、最適な分類面のドット積を置き換えます。最適化関数は次のとおりです。2-5

対応する識別機能は次のとおりです。2-6

回帰パラメータは次のようになります:2-7

次の制限があります。

上記の制限条件の下で、ラグランジュ乗数は式(2-7)によって得られます。ゼロ以外の場合のみ、サポートベクトルSVMに対応し、次の形式の回帰関数、つまり舌像色
補正関数f(x)が得られます。

その中で:

現在、3つの主要な内部積関数があります
。1。多項式形式の内部積関数、すなわち  

2.カーネル関数タイプの内部積を
使用します。3。内部積としてシグモイド関数を使用します

SVRに基づく色補正アルゴリズムは、イプシロンに影響されない損失関数を使用し、内部積関数はガウスカーネル関数です。最初に、3つのモデルを確立する必要があります。各モデルの入力データは同じで、補正
するカラープレートの24個のカラーパッチのRです。 、GおよびB値、出力はそれぞれR値、G値およびB値です。モデルを構築するには、最初にパラメータCとgを選択します。p値、C値はSVRのエラーペナルティの重み、g
カーネル関数のパラメータのガンマ、pは許容誤差イプシロンです。ここでは、3チャネルモデルのパラメータは次のようになります。同じ。3つのパラメータの選択方法
は、1つのパラメータのみを変更するたびに、他の2つのパラメータを固定し、キャリブレーション前後のラボスペースに応じて選択します パラメータが小さいほど、このパラメータでの結果は良くなります。

キャリブレーションアルゴリズムの評価

      さまざまな方法で舌や顔の画像の色補正を行った後、さまざまな方法の長所と短所を評価するための統一された基準が必要です。色再現の評価には、比色分析、生理学、心理学
などの分野が含まれます。非常に複雑な問題であり、一般的に使用される評価方法は、主観的評価と客観的評価に分けられます。
主観的評価とは、一部の観察者が色補正の品質を視覚的に評価およびスコアリングし、スコアに基づいて色再現の品質を判断できるようにすることです。この方法は直感的で信頼性がありますが、
色の再現を定量的に分析することはできません客観的な評価は、特定の条件下で特定のカラースケールのセットを使用し、一般にCIELabとCIELUV空間を使用して、三刺激値の差を計算することによって判断することです。乗客の
欠点の概念評価は、主観的効果の最小補正三刺激差が最良ではないことが多いことです。
      本稿では、客観的評価と主観的評価を組み合わせた方法を採用し、まず客観的評価を行い、より良い結果を選び、補正画像の実際の効果を観察し、最後に判断を下します。客観的評価では、
主にラボスペースを使用し、RGBスペースを補助として使用します。ラボスペースでは、

測定するには、avg(X)がXの平均値、max(X)がXの最大値、min(X)がXの最小値であり、
それぞれK個の参照カラーパッチがあると仮定すると、i番目のカラーパッチはに対応します。標準値は、i番目のカラーブロックに対応して補正するラボ値です。上記の客観的評価で使用した値の計算式は次のとおりです。

おすすめ

転載: blog.csdn.net/a8039974/article/details/109132496