序文: この記事では、過去 5 年間の生成クロスモーダル ステガノグラフィーの分野における関連研究を紹介します。
テキスト ステガノグラフィとは異なり、クロスモーダル ステガノグラフィでは、異なるモダリティ間の相関関係を考慮する必要があります。一般的なクロスモーダル シナリオには、画像からテキストへの変換 (画像の説明など)、テキストから音声への変換 (音声アシスタントなど)、テキストが含まれます。 -to-Image(テキストに従って描画するなど)など。以下では、深層学習に基づく生成クロスモーダル ステガノグラフィーに関する関連研究を紹介します。
[1] -画像説明に基づくテキスト情報の隠蔽 (北京郵電大学ジャーナル、2018) BUPT、Xue et al。
- 主なアイデア: CNN+LSTM フレームワークを採用し、ビーム検索に基づいて検索方法を変更します。まず、暗号文の長さを示すために 16 ビットの情報が暗号文のヘッダーに追加され、その後、さまざまな受信者共有シナリオに従って各設計が設計されます。
- 文ベースの隠蔽アルゴリズム (SSH): ビーム検索を使用し、すべての単語が生成された後、2 n 2^{n}をペアリングします。2n個の候補文を同じ長さで符号化し、最終文の選択過程に秘密情報を埋め込む。
- ワードベースの隠蔽アルゴリズム (WWH): ビームの長さが 1 の場合、ビーム検索は貪欲検索に退化します。各タイムステップで単語を生成する場合、固定候補単語セットは 2 であり、暗号文が 1 の場合は確率の高い単語が選択され、暗号文が 2 の場合は確率の小さい単語が選択されます。
- ハッシュ関数に基づく隠蔽アルゴリズム(HH): 以下の式により各単語が1ビットの秘密情報に対応し、テキストに基づいて秘密情報を抽出することができます。
v ( w , key ) = ( md 5 ( w + key ) ) mod 2 v(w, key) = (md5(w+key)) mod 2v ( w ,キー)_=( m d 5 ( w+キー) ) mod 2 _ _
- データセット: Flicker8k
- 評価指標: 埋め込み能力:
bpw
; 意味的関連性:BLEU-N
[2]- Rits: 自動対話モデルに基づくリアルタイム インタラクティブ テキスト ステガノグラフィー (ICCCS、2018)清華大学、Yang et al。
この記事はクロスモーダル記事ではありませんが、生成されたステガノグラフィー テキストは認知的に知覚不可能であるべきである、つまり、そのセマンティクスがコンテキストのセマンティクスに関連している必要があると指摘しています。この見解はクロスモーダルの分野でも同じです。モーダル テキスト ステガノグラフィー。該当すること。
- 主なアイデア: 対話シナリオでは、RNN + 強化学習を使用し、完全なバイナリ ツリーに基づく固定長コーディングを使用して秘密情報を埋め込みます。
- データセット: 対話データセットネゴシエーター
- 評価指標:効率性:
time
[3]-相互認識された共同注意を伴うステガノグラフィーのビジュアル ストーリー (EURASIP、2021)上海大学、Guo et al。
- 主なアイデア: この記事は、認知的不知覚性を確保するには確率分布の分散が一定の範囲内になければならないことを提案し、候補単語セットに対する適応的な情報埋め込みおよび抽出方法を設計します。
- データセット: VIST
- 評価指標: 視覚的知覚不能性:
Perplexity
; 認知的知覚不能性:BLEU
&METEOR
[4]- ICStega: 画像キャプションベースの意味的に制御可能な言語ステガノグラフィー (SPL、2023) USTC、Wang et al。
- 主なアイデア: この記事は主に意味制御に基づいた候補単語セットの構築方法を提案します。
- データセット: MS COCO
- 評価指標: 埋め込み量:
bpw
、視覚的知覚不能性:Perplexity
、セキュリティ: ステガナリシス耐性 TS-FCN、認知的知覚不能性:BLEU
&METEOR
、多様性:LSA
&Self-CIDEr
[5]-同義語置換ベースのテキスト攻撃に対するクロスモーダル テキスト ステガノグラフィー (SPL、2023)復旦大学、Peng et al。
- 主なアイデア: 同義語置換攻撃、非可逆ステガノグラフィーに抵抗し、DNN を使用して機密情報をエンコードし、デコード ネットワークで情報のロックを解除します。
- データセット: MS COCO
- 評価指標: 統計的知覚不可能性:
KL散度
; ステガ分析に対する耐性:LS-CNN
&R-BIC
&SeSy
&BERT-FT
- オープンソースコード: https://github.com/hunanpolly/Cross-Modal-Steganography
[6]-深層生成モデルによる再現可能なステガノグラフィーをカバー (TDSC、2022) USTC、Chen et al。
- アプリケーション シナリオ: テキスト読み上げ、テキストから画像への変換
[7]- Text-to-Speech 生成モデルに基づく分布保存ステガノグラフィー (TDSC、2022) USTC、Chen et al。
- アプリケーションシナリオ: テキスト読み上げ
- オープンソースコード: https://github.com/coriverchen/ProvivelySecureSteganography