DCTとDWTの組み合わせに基づくオーディオ透かしアルゴリズム

マルチメディア技術の発展とネットワーク技術の普及により、情報セキュリティの問題はますます顕著になっています。同時に、知的財産権に対する人々の意識が徐々に高まるにつれて、著作権侵害追跡と著作権の維持の問題もまた、人々に新しいより効率的な情報セキュリティ技術を求めるようになりました。従来の情報セキュリティ技術は基本的に暗号理論[1]に基づいており、それが従来の鍵システムでも公開鍵システムでも、その保護方法はファイルアクセスの制御です。しかし、コンピュータの処理能力の急速な向上に伴い、キーの長さを継続的に増加させることによってシステムのセキュリティレベルを向上させるこの方法は、ますます安全でなくなりました。したがって、オープンな情報交換環境でいかに著作権保護を行うかが喫緊の課題である。

電子透かし技術は、近年この問題に対応して開発された情報セキュリティ技術です。電子透かしは、著作権所有者のマークまたはID番号を透かしデータとして所有者の作品に埋め込みます。ここでの作品は、一般に海賊に持ち込まれる可能性のある生産資料またはあらゆる種類の消費財です。収益性の高い製品(視聴覚製品など)。そのような製品の大量の販売とネットワークと情報のデジタル化の発達のために、違法コピーは非常に簡単です。したがって、近年、画像透かし[2]およびビデオ透かしの開発は比較的急速であり、主に人間の視覚モデル(つまりHVS)を使用して、人が感じられない場所に透かしを埋め込みます。侵害紛争が発生した場合、透かし検出と透かし抽出は、起訴の証拠として使用されます[3]。

    現在、音声透かし技術は徐々に発達しており、人間の聴覚モデル(HAS)を利用して、人間の耳が認識できない位置に透かしを埋め込んで、透かしデータを隠しています。透かし技術は、透かしを埋め込む位置に応じて、時間領域の透かしアルゴリズムと変換領域の透かしアルゴリズムに分けることができます。初期の透かしアルゴリズムは、元のオーディオ信号の最下位ビットを変更して、透かしを埋め込む目的を達成しました。文献[4]は、さまざまな埋め込みモードを事前に分類して定義し、最適な埋め込みモードを適応的に選択して、元のオーディオ信号のエコーに透かしを埋め込むことを提案しました。文献[5]は、ウェーブレット変換に基づく透かし手法を提案しました。文献[6]は提案しました離散コサイン変換に基づく透かしアルゴリズム。上記の文献からわかるように、時間領域透かしアルゴリズムは堅牢で堅牢ではないため、変換領域透かしアルゴリズムは近年急速に発展しています。変換ドメインの一般的な透かしアルゴリズムには、フーリエ変換、離散コサイン変換、離散ウェーブレット変換が含まれますが、これらの変換アルゴリズムには、独自の長所と短所があります。

上記の透かしアルゴリズムの分析と研究に基づいて、本論文は、透かしを埋め込んで抽出するための離散ウェーブレット変換と離散コサイン変換の組み合わせに基づく方法を提案し、ウェーブレット変換の多重解像度特性と離散コサイン変換のエネルギー圧縮性を活用する。 、透かしとして直感的なバイナリ画像を使用して、新しいオーディオ透かしアルゴリズムが提供されます。実験は、アルゴリズムの堅牢性と知覚不能性を証明します。

高速ウェーブレット変換を使用して、特定のウェーブレット関数を選択し、特定のスケールで入力信号を分解し、このスケールで信号の高周波部分と低周波部分を取得します。1つのスケールでは、高周波部分と低周波部分に前のスケールの完全な復元が含まれます信号のすべての情報をダウンロードします。この分解を繰り返すと、信号のマルチスケール分解が得られ、信号の多層ウェーブレット係数、つまり、信号の低周波係数と一連の高周波係数が得られます。図1に示すウェーブレット分解ツリー。

図1ウェーブレット分解ツリー

図1ウェーブレット分解ツリー

ほとんどの信号では、低周波数部分が信号の特性を示します。これは多くの場合最も重要ですが、高周波数部分はノイズと妨害に関連しています。信号の高周波部分を削除しても、信号の基本的な特性は保持されます。したがって、この部分は一般的な信号処理が行われます。したがって、信号解析では、信号の近似と詳細がしばしば言及されます。近似は主にシステムのグローバルで低周波の部分ですが、詳細は信号のローカル成分と高周波成分であることがよくあります。

信号を相互に直交するウェーブレット関数の線形結合に分解すると、信号の重要な特性を示すことができますが、これはウェーブレット分析の全体ではありません。ウェーブレット分析のもう1つの重要な側面は、ウェーブレット係数を分析、比較、処理(高周波信号の削除、暗号化など)し、新しく取得した係数に従って信号を再構築することです。このプロセスは、逆離散ウェーブレット変換(IDWT)、またはウェーブレット再構成、合成などと呼ばれます。信号再構成の基本的なプロセスを図2に示します。

アルゴリズムのフローチャートを図3に示します。

                                       図3アルゴリズムのフローチャート

 図3アルゴリズムフローチャート

実験では、図4(a)に示すように、透かし情報を64×64バイナリイメージとして選択します。透かし画像は、最初に次元が削減され、次にスクランブルされます。スクランブルされた画像を図4(b)に示します。次に、元のオーディオ信号がセグメント化され、透かしの埋め込みに使用されるオーディオ信号が3レベルのウェーブレットによって分解されます。このホワイトペーパーでは、「db1」ウェーブレットベースが選択され、3レベルのウェーブレット分解の近似コンポーネントに対して離散コサイン変換が実行され、その後、離散コサイン変換係数が実行されます。ソートし、最後に式(8)に従ってウォーターマークをオーディオ信号に埋め込みます。埋め込み処理中は0.2をとります。図5(a)は、モノ、22.05kHzのサンプリングレート、8ビットの量子化、および周期長が8sの元のオーディオ信号です。図5(b)は、透かしが埋め込まれた後のオーディオ信号であり、2つのオーディオ信号はほぼ違いはありません。   

      

 

図.4透かし画像

         

         (A)元のオーディオ信号;(b)透かし入りのオーディオ信号

図5透かし信号

図5オーディオ信号

アルゴリズムのロバスト性を検出するために、透かしを入れたオーディオ信号に対して次の処理を実行しました:①ガウスホワイトノイズのSNRは30で、抽出された透かしは図4(c)に示されています。②再サンプリング、信号は一度抽出されます補間、間引き、補間係数は2です。抽出した透かしを図4(d)に示します。③ローパスフィルターをカットオフ周波数4 kHzのビチェシェフローパスフィルターに通し、図4(e)に示すように透かしを抽出します。④信号のビットレートは80kb、圧縮率は8.8です。 :1の状態で抽出された透かしを図4(f)に示します。

正規化係数は0.823 5、0.601 2、0.682 6、0.596 1です。上記の実験から、アルゴリズムは通常の信号処理に対してロバストであることがわかります。

おすすめ

転載: blog.csdn.net/ccsss22/article/details/108741499
おすすめ