角度誘導変圧器融合ネットワークに基づくマルチステーション協調目標認識法

出典: レーダージャーナル

著者: Guo Shuai、Chen Ting、Wang Penhui、Ding Jun、Wang Yinghua、Yan Junkun、Liu Hongwei

まとめ

複数局の協調レーダー目標認識は、複数局の情報の相補性を利用して認識性能を向上させることを目的としています。従来のマルチステーション協調ターゲット認識方法は、ステーション間のデータの違いを直接考慮しておらず、通常は比較的単純な融合戦略を採用しているため、正確でロバストな認識パフォーマンスを得ることが困難です。この論文では、マルチステーション協調レーダー高解像度レンジ プロファイル (HRRP) ターゲット認識のための角度誘導変圧器融合ネットワークを提案します。ネットワークは、単一ステーション HRRP のローカルおよびグローバルな特徴を抽出するための特徴抽出の主な構造として Transformer を使用します。そしてこれに基づいて、マルチステーション特徴融合学習、アングルガイダンスモジュール、フロントレベル特徴インタラクションモジュール、およびディープアテンション特徴融合モジュールを促進するために、3 つの新しい補助モジュールが設計されています。まず、角度誘導モジュールは、ターゲット方位角を使用してステーション間のデータの違いをモデル化します。これにより、提案されたフィーチャとマルチステーションの視点間の対応が強化され、フィーチャの堅牢性と一貫性が向上します。第二に、フロントレベル機能インタラクションモジュールとディープアテンション機能融合モジュールを組み合わせた融合戦略により、各ステーションの機能の多段階の階層的融合が実現されます。最後に、測定データに基づいて、協調認識実験のために複数ステーションのシナリオをシミュレートし、その結果、提案手法が複数ステーション協調のターゲット認識性能を効果的に改善できることを示した。

キーワード

マルチステーション協調レーダー目標認識 / 高解像度レンジプロファイル (HRRP) / 角度誘導 / 注意機能融合 / 変圧器融合ネットワーク 

1 はじめに

レーダー高解像度レンジ プロファイル (HRRP) は、広帯域レーダー信号によって取得されたレーダー光線の方向に投影されたターゲット散乱点エコーのベクトル和に基づいており、多数の物体が含まれています。ターゲットのサイズ、ターゲットの物理構造、および散乱点の分布に関する関連情報。このうち、HRRP の変動はレーダー視線に沿ったターゲットの散乱構造の分布を反映し、HRRP のピークは散乱構造の強度を反映します。また、1次元のHRRPデータは、2次元の合成開口レーダー画像と比較して、取得が容易であり、記憶リソースが少ないという特徴がある。このため、HRRP はレーダー自動目標認識 (RATR) の分野で広く使用されています。

現在、HRRPに基づくレーダー目標認識技術は、主に単一レーダーで取得したエコーを主なデータソースとして使用し、主な特徴抽出モジュールとしてディープネットワークなどの手法を使用し、分類器と連携して未知のカテゴリー判定を実現しています。 [1-3]をターゲットにします。しかし、アプリケーションシナリオがますます複雑になるにつれて、単一レーダーに基づくHRRPターゲット認識システムは、複雑なシナリオのパフォーマンス要件を徐々に満たすことができなくなり、認識精度と信頼性を保証することが困難になります。この問題を解決するために、多局協調目標認識技術が解決策を提供します。複数のレーダーを使用して、同じターゲットを異なる距離および異なる視点から同時に観察し、複数ステーションのデータ間の情報の補完性を利用して、より正確で堅牢なターゲット認識を実現します [4-7]。

マルチステーションの協調目標認識には主にレーダー情報融合処理技術が含まれており、情報フロー内の融合モジュールの位置に応じてデータ融合、特徴融合、決定融合にさらに分類できます。図 1 に示すように、上記の 3 つの融合方法は、入力データの次元のスプライシング、中間隠れ層の特徴のスプライシング、および出力認識確率の重み付けを通じて、複数ステーションのレーダー協調認識を実現します。

写真
図1 核融合ネットワーク構造の模式図

近年、複雑なシーンにおける複数ステーションの協調ターゲット認識方法が、RATR の分野で徐々に研究の焦点になってきています [8-12]。文献 [13] では、角度の異なる 2 つのレーダセンサで取得したレーダデータから特徴を抽出し、抽出されたデュアルレーダ微動特徴を抽出する、特徴スプライシングに基づくデュアルレーダ微動特徴融合認識手法が提案されている。融合し、最後に分類にサポート ベクター マシンを使用します。文献[14]では、複数のレーダで受信したエコーの時空間位置合わせとデータ関連付けを行い、歩行者や自転車の自動検出・追跡・分類を実現するマルチレーダセンサフュージョンに基づく歩行者認識手法が提案されている。文献 [15] は、マルチ レーダー センサー ネットワークにおけるターゲット決定融合の問題を研究しており、この研究では、決定融合問題を多入力多出力 (Multi-Input Multi-Output、MIMO) システムとしてモデル化し、MIMO 融合を提案しています。ルール。上記の研究結果は、マルチアングルまたはマルチサイトレーダーによって観測されたエコー信号の協調認識が、ターゲット認識の精度とロバスト性の向上に役立つことを示しています。しかし、現在の多ステーション協調目標認識方法には、ステーション間のデータの相関と差異のモデリングが不足しており、ステーション間のデータの差異が大きい場合、より優れた認識性能を達成することが困難な場合が多い。また、既存手法の融合戦略は比較的単純であり、データスプライシング、特徴スプライシング、重み付け意思決定などの手法が主に使用されているため、複数局の情報を十分に活用することが難しく、性能向上に限界がある。既存のマルチステーション協調ターゲット認識方法をある程度活用できます。

上記の問題を目指して,本論文は,角度誘導変圧器融合ネットワークに基づくマルチステーションHRRP協調認識法を提案する。まず、Transformer 構造を特徴抽出器として使用し、その優れた長距離依存関係抽出能力を利用して、HRRP データ自体の時間的特徴と空間的構造相関を抽出し、ターゲットの特徴を表すエコー特徴を取得します。構造。第二に,マルチステーションデータの大きな差異の問題を目指して,本論文は角度誘導モジュールを設計した。このモジュールは、ターゲット方位角を補助情報として使用して、複数ステーションのデータの差異をモデル化します。一方で、提案された特徴とターゲット方位の間の関係が強化され、外乱に対するモデルの能力が向上し、抽出された特徴がより正確になります。堅牢; 一方では、方位角を使用して複数ステーションの隠れ層フィーチャ間の非線形マッピングを構築するため、角度ガイダンス モジュールによって修正されたステーション フィーチャは潜在空間内でより良い一貫性を持ち、発生する問題が軽減されます。多局データの差が大きいことによる融合認識性能不足の問題 次に,既存のメソッド融合戦略が単純であり,マルチステーション情報を十分に活用することが難しいという問題を考慮して,本論文は,マルチステーションの観点からフロントレベル特徴インタラクションモジュールとディープアテンション特徴融合モジュールを設計した。段階的な特徴融合を実現し、各ステーションの特徴統合を実現 特徴抽出のさまざまな段階での階層的な融合。最後に,測定データに基づいてマルチステーションシミュレーション実験を設計し,実験結果は,本手法がマルチステーションHRRP特徴融合を効果的に実現でき,単一ステーションや従来の融合手法よりも優れた認識性能を得ることができることを示した。

2. 多局協調認識モデル

2.1   モデルの概要

本稿では角度誘導トランスフォーマー融合ネットワークに基づく多局HRRP協調認識手法を提案し、その全体構造を図2に示す。モデルは単一ブランチ特徴抽出部分とマルチブランチ特徴融合部分に分けることができます。単一ブランチ特徴抽出部分では、各レーダーによって取得された HRRP がまずデータ前処理として処理され、入力 HRRP に対してモジュロ 2 ノルム正規化、振幅感度と変換感度を除去するためのアライメントが行われます。次に、前処理された個々の HRRP サンプルがサブシーケンスに分割され、マッピングされ、位置がエンコードされます。次に、2 つの Transformer レイヤーをカスケード接続することによって、HRRP 特徴が抽出されます。最後に、角度ガイダンス モジュールを使用して、各ブランチのターゲット方向に対応する特徴が強化されます。マルチブランチ特徴融合の部分では、まずフロントレベル特徴インタラクション モジュールを使用して、特徴学習段階で各ステーションの HRRP 特徴を融合します。この早期融合戦略により、各ブランチが他のブランチの情報を事前に取得できるようになり、後続の融合タスクの難易度が軽減されます。次に、ディープ アテンション特徴融合モジュールのセルフ アテンション メカニズムを使用してマルチステーション特徴と対話し、各ステーションの特徴間の相互依存関係を取得し、強度に応じて適応的なマルチステーション特徴融合を実行します。依存関係。最後に、分類レイヤーを使用して融合された特徴を分類し、予測されたターゲット クラスを取得します。

写真
図 2 角度誘導変圧器融合ネットワーク構造

2.2   データの前処理

HRRP の方向感度、振幅感度、並進感度は、モデルによって抽出された堅牢なターゲット特徴に一定の影響を与えるため [16]、HRRP 感度の影響を軽減するために、前処理の前に HRRP を正規化して調整する必要があります。単一のブランチを例にとると、複雑な HRRP データは \boldsymbolr=[r1,r2,⋯,rL]T で表されます。ここで、riri は i 番目の距離ユニットのサブエコーを表し、L は総数を表します距離の単位。複素 HRRP データの振幅を取得して、実際の HRRP データ \boldsymbolx=|\boldsymbolr|=[x1,x2,⋯,xL]T を取得します。振幅感度を目的として、この論文ではモジュロ 2 ノルム正規化を採用して実際の HRRP データを処理し、振幅正規化後に HRRP サンプルを取得します。

写真

、今すぐ

写真

   (1)    

この論文では、重心位置合わせ方法を使用して、平行移動の感度を克服します。xnorm の重心が距離ウィンドウの中心にくるように巡回シフト演算を行い、重心を合わせた後の HRRP サンプル xalign∈R1×L を取得します。xnorm の重心 G は式 (2) で計算できます。

写真

   (2)    

で、

写真

xnorm の l 番目の距離単位の大きさの値を示します。

Transformer モジュールを使用してターゲットのローカル下部構造の特性をキャプチャするには、図 3 に示すように、xalign でセグメンテーション マッピングを実行し、位置エンコーディングを追加することも必要です。xalign の分割方法では、レーダーの範囲解像度、ターゲットの下部構造の記述の粒度、モデルの計算の複雑さの影響を包括的に考慮する必要があります。各 HRRP サブシーケンスの長さを P、分割された HRRP サブシーケンスの数を N=L/P とすると、xalign を複数のサブシーケンスに分割すると、次のように表すことができます。

写真

 :

写真
図 3 セグメンテーション マッピングと位置エンコーディング

写真

   (3)    

で、

写真

次に、分割後の各部分列について

写真

入力をエンコードするには、

写真

D 次元ベクトルとしてエンコードします。

写真

入力エンコード後に xemb を取得します。つまり

写真

   (4)    

で、

写真

入力エンコーダーを示します。

写真

サブシーケンスのエンコーディングを示します。

写真

エンコードされた HRRP を示します。この論文では、入力エンコーダは線形全結合層で実装され、すべてのサブシーケンスが入力エンコーダを共有します。

同時に、HRRP の各サブシーケンスに関する情報を公平に集約するために、HRRP サブシーケンスの前に集約ベクトルを追加します。

写真

、各ステーションの HRRP の機能を深い注目機能融合モジュールに集約します。第二に、HRRP サブシーケンスの空間的位置関係を最大限に活用するために、この論文では、集約ベクトルと xemb に各 HRRP サブシーケンスの学習可能な時間位置コードを追加します。

写真

   (5)    

で、

写真

位置エンコード行列を表し、

写真

前処理モジュールの出力を表し、最初の Transformer レイヤーの入力としても機能します。

2.3    変圧器モジュール

HRRP 部分列はターゲットの局所部分構造の記述であり、本稿では Transformer を使用してターゲットの局所部分構造内および部分構造間の特徴を抽出します。Transformer はアテンションメカニズムを備えたモデルであり、近年多くの分野で優れたパフォーマンスを発揮し、シーケンスモデリング問題において既存の CNN、RNN および他のモデルを徐々に置き換えてきました [17,18]。対照的に、CNN 構造は浅く積み重ねると大域的な相関を取得することが難しく、RNN 構造は長いシーケンスの長距離依存関係をモデル化することが困難です。Transformer 構造は、より優れた長距離依存関係表現能力を備えており、セルフ アテンション メカニズムを使用して、各 HRRP サブシーケンスのローカル相関とグローバル相関をキャプチャできます。Transformer モジュールは、図 4 に示すように、レイヤー正規化、マルチヘッド セルフ アテンション レイヤー、およびフィードフォワード レイヤーで構成されます。各層の機能と役割については、以下で詳しく説明します。

写真
図4 変圧器モジュール

Transformer モジュールにおける層正規化の位置は、トレーニング中の安定性に影響します。Pre-norm[19] は、層正規化操作を残留接続操作の前に置きます。これにより、ネットワーク層の数が深い場合にモデルをより適切に防ぐことができます。またはグラデーションの消失。したがって、ここではプレノルムを使用して入力シーケンス xin を正規化します。

写真

   (6)    

で、

写真

xinに対してレイヤ正規化を行った出力を示し、LNはレイヤ正規化を表します。

Transformer モジュールのマルチヘッド セルフ アテンション レイヤーは、各入力シーケンスのローカルおよびグローバルな関係をキャプチャし、長距離に依存する特徴を抽出し、HRRP エコーとエコーの複雑な変動をキャプチャするモデルの能力を強化するために使用されます。 HRRP サブシーケンス間の構造相関。マルチヘッド アテンション レイヤーの具体的な実装は次のとおりです。

写真

線形マッピングをそれぞれ 3 回実行し、クエリ行列 QQ とキー行列 KK の積を計算し、スケーリングで割ることにより、dq 次元のクエリ行列 Q、dk 次元のキー行列 K、および dv 次元の値行列 V を取得します。要素

写真

、式 (7) に示すように、ソフトマックス関数を適用して注意の重みを取得し、注意の重みに従って値行列 V に重みを付けて自己注意の出力を取得します。

写真

   (7)    

で、

写真

マルチヘッド アテンションをさらに取得するには、複数の独立したアテンション ヘッドを使用して、上記のクエリ行列 Q、キー行列 K、および値行列 V を複数の特徴部分空間に投影し、対応するセルフ アテンションの結果を計算する必要があります。そして最後に、式 (8) に示すように、さまざまな部分空間の結果が結合されて、マルチヘッド アテンション メカニズムの出力が得られます。

写真

   (8)    

で、

写真

、h は注目ヘッドの数を表します。

写真

Transformer モジュールのフィードフォワード層には多層パーセプトロンが含まれており、入力を高次元の隠れ空間にマッピングし、その後、高次元の隠れ空間から元の空間にマッピングして、特徴抽出と隠れた空間への入力をスクリーニングします。フィードフォワード層の出力は式 (9) で表されます。

写真

   (9)    

で、

写真

フィードフォワード層の入力として、層正規化後に特徴を追加した後のマルチヘッド アテンション メカニズムと短絡接続の特徴の出力でもあります。MLPMLP は、2 つの完全に含まれる多層パーセプトロンを表します。接続されたレイヤー。Transformer モジュール全体の最終出力は式 (10) で表されます。

写真

   (10)    

このうち、Transformer(⋅)はTransformer層を表します。

2.4    角度ガイドモジュール

多局融合とは、複数の局が異なる視点から観測した情報の多様性を最大限に活用し、認識性能を向上させることです。ただし、観測角度が異なると、複数のステーションで受信したデータの差が通常大きくなり、直接融合ではより良い結果を得ることが困難になることがよくあります。目標方位角は、目標の移動方向とレーダーの視線との間の角度であり、各ステーションの観測角度は異なる目標方位角に対応するため、目標方位角を使用してマルチステーションの違いを説明できます。データ。したがって,本論文は,各ステーションのデータが大きく異なるという問題を解決するために角度案内モジュールを設計した。一方で、対応するターゲット方位角を各レーダーステーションのHRRP特徴抽出プロセスに導入することにより、抽出された特徴とターゲット方位角の間の対応関係が強化され、モデルの外乱に対する耐性が向上します。また、比較的堅牢なターゲット特徴を抽出することは有益です。一方、以前の研究[20,21]によれば、異なる視野角の下でのターゲットエコー間にはマッピング関係があり、方位角エンコーディングを使用してマルチステーション隠れ層特徴に非線形マッピングを構築し、これにより改善されます。隠れた空間の各ステーションの特性を一貫性により、データの違いによって引き起こされる融合の困難な問題を軽減できます。

角度誘導モジュールの入力は、多層変圧器モジュールの出力特徴 ff と目標 HRRP に対応する方位角 a の 2 つの部分で構成され、その構造を図 5 に示します。まず、a は 2 つの全結合層で構成される角度符号化モジュールによって線形符号化され、出力 γ(a) は次のように表されます。

写真
図 5 角度誘導モジュール

写真

   (11)    

このうち、 W1 、 W2 、 b1 、 b2 はそれぞれ 2 つの線形変換の重みとバイアスを表します。次に、Transformer 層の出力特徴は、畳み込みモジュールのマッピング関数 Rℜ に基づいて特徴マッピングされます。マッピング関数 Rℜ は、2 つの畳み込み層、バッチ正規化層、および GELU 活性化層で構成されます。最初の畳み込み層は入力特徴 ff の特徴チャネルの数を 2 倍にし、2 番目の畳み込み層の出力チャネルの数は入力特徴 ff と同じままです。特徴マッピングのプロセスは次のように表されます。

写真

   (12)    

このうち、BNBN はバッチ正規化を意味し、1D-Conv(⋅) は 1 次元の畳み込み演算を意味し、非線形活性化 GELU の式は GELU(x)=x⋅Φ(x) です。ここで Φ(x) はガウス分布ですの累積確率分布。最後に、マッピングされた特徴に角度エンコーディングが乗算され、残差接続を使用して入力特徴 ff と合計されます。角度ガイド層の出力特徴 fout は次のように表すことができます。

写真

   (13)    

2.5   事前機能インタラクション モジュール

従来の特徴融合手法は、単一ステーションの HRRP 特徴抽出モジュールによって出力された特徴を融合することであり、この融合手法は深い特徴のみを融合し、入力された浅い特徴間の関係を考慮しません。特徴抽出の初期の段階で特徴相互作用を追加すると、ターゲットを事前に多くの側面で記述することができ、後続の特徴融合タスクの難易度が軽減されます。したがって、モデルの多段階特徴融合の観点から、この論文の方法は、フロントレベル特徴相互作用モジュールとディープアテンション特徴融合モジュールを設計し、マルチステーション特徴の多段階階層融合を実現します。特徴抽出プロセス。フロントレベルの特徴相互作用モジュールを図 6 に示します。特徴融合のタイミングを前方に移動することにより、モデルは浅い特徴の抽出中に他のレーダーからの浅い特徴との相関学習を実行できます。

写真
図 6 フロントレベル機能対話モジュール

ここでは、3 サイト インタラクションを例として、フロントレベル機能インタラクション モジュールの具体的なプロセスを紹介します。フロントレベル機能インタラクションモジュールの入力機能は、各ステーションの角度ガイダンス層の出力です。

写真

、上付き文字はステーション番号を表します。フロントレベルの機能対話モジュールの出力は次のように表すことができます。

写真

   (14)    

で、

写真

フロントレベルの特徴相互作用モジュールによって出力される 3 つの相互作用特徴を表します。 w11 、 w12 、 w13 、 w21 、 w22 、 w23 、 w31 、 w32 、および w33 は、各ステーションの特徴相互作用の重みです。この論文の方法は、各ステーションの特徴相互作用がより十分になるように、特徴抽出段階で 2 つのフロントレベルの特徴相互作用モジュールを設計します。最初の機能インタラクションの出力が Transformer レイヤーを通過した後、2 番目のフロントレベル機能インタラクション モジュールの入力として使用されます。2 番目の機能インタラクション モジュールの出力がそれぞれ使用されます

写真

2.6   ディープ・アテンション機能融合モジュール

マルチステーションの協調ターゲットシナリオでは、マルチステーションの特徴融合が堅牢で正確な認識を実現する鍵となります。本論文で設計した多段特徴融合は,マルチステーション特徴を重み付けするプレレベル特徴相互作用に加えて,ディープアテンション特徴融合モジュールも設計しており,モジュールの具体的な構造を図7に示す.このモジュールは主にステーション間のマルチビュー特徴の相補性を使用し、セルフアテンションメカニズムを通じてステーション間の特徴の相関をモデル化し、相互依存の強さに応じてモデルの深い段階で適応的な特徴融合を実現します。取得した局間特徴量を利用して、より正確な認識結果を得ることができます。

写真
図 7 ディープ アテンション機能融合モジュール

ディープ アテンション特徴融合モジュールの入力は、2 つ前の特徴インタラクション モジュールによって出力されたインタラクション特徴です。

写真

写真

まず、特徴抽出により得られた複数局の特徴はそれぞれの特徴空間に存在し、注目特徴を融合する前に、各局の特徴を共有ディープマッピング層を介して同一の高次元特徴空間にマッピングする必要がある。 、つまり

写真

   (15)    

で、

写真

それぞれ、入力 HRRP 上の各サブシーケンスの情報を集約する上記の入力インタラクション特徴量の cls 集約ヘッドの位置に対応する特徴量を表し、Linear(⋅) は線形層を表します。

次に、Transformer 層のセルフアテンション メカニズムを使用して、マルチステーションの特徴を分析します。

写真

それらの間の相関をモデル化します。B はディープ マッピング後の高次元特徴空間の次元です。マルチステーション特徴融合の出力は入力順序とは独立している必要があるため、ここでは位置コーディングがマルチステーション特徴に追加されないため、特徴融合に使用されるトランスフォーマは順列不変性を持ちます。次に、平均プーリングを使用して相互作用した特徴を処理し、最終的な融合特徴を取得します。ディープ アテンション フィーチャー フュージョン レイヤーからの出力は次のように表すことができます。

写真

   (16)    

で、

写真

複数のステーションが入力として結合されることを示し、Transformernp(⋅) は順列不変の Transformer 層を表し、Avgpooling(⋅) は平均プーリング操作を表します。最後に、分類ヘッドを使用して融合特徴のターゲット カテゴリを予測し、認識結果を取得します。

マルチステーション協調シナリオにおける融合認識を考慮すると、モデルはステーション間の入力シーケンスの変化に鈍感であるべきである、すなわち、モデルは順列不変性を有するべきであることが提案される。RNN などの従来の逐次ニューラル ネットワークは、入力シーケンスの順序に敏感であり、入力データの無秩序の相関モデリングを実現することが困難です。ただし、この論文で使用されている順列不変の Transformer は、この特性によく適合します。順列不変の Transformer と特徴抽出に使用される Transformer 層の比較を図 8 に示します。特徴抽出段階では、Transformer が HRRP 特徴抽出に使用される場合、図 8(a) に示すように、追加の位置コードが HRRP サブシーケンスのグローバル特徴抽出に導入されます。ただし、順列不変トランスフォーマーは、位置エンコーディング操作を放棄することで順序付けされていないデータ間の相関モデリングを実現するため、図 8 に示すように、マルチステーション融合の出力結果は各ステーションの入力 HRRP 特徴順序とは無関係になります。 (b)。

写真
図 8 順列不変の Transformer と Transformer 特徴抽出層の比較

3. 実験と結果の分析

3.1   対象データと実験設定

実験に使用した測定データは、ある経路上で単一のレーダーによって収集されたタイプ 5 ターゲットエコーであり、レーダーパラメーターは表 1 に示されています。データ収集プロセス中、ターゲットの半径距離は 40 ~ 100 km の範囲で変化し、方位角は 2° ~ 50° の範囲で変化します。そして、測定データは物標の距離と方位角の変化に応じて3つの部分に分割され、各部分のデータが各レーダ局の観測データとして利用される。このうち、各観測点の観測データにおける物標の距離変動範囲は約20km、方位角の変動範囲は約16°である。本論文では、上記の手法により 3 駅シーンをシミュレートし、協調認識実験を実施した。

写真

表 1 レーダーパラメータ

実験で観測されたターゲットには 5 種類の民間航空旅客機が含まれており、さまざまなターゲットの物理パラメータを表 2 に示します。図 9 は、シミュレートされた 3 局のシナリオに対応する HRRP を示しています。図の各行は異なるタイプの航空機を表し、各列は異なるレーダー サイトを表しています。異なる視野角の下で同じターゲットの観測された HRRP 間には明らかな違いがあることがわかり、マルチステーション調整の条件下ではターゲットに関連するより多くの情報を取得できます。

写真

表 2 対象となる物理パラメータ

写真

図 9. シミュレーションされたマルチサイト シナリオのターゲット HRRP

実験では、ターゲットの種類ごとに異なる出撃のデータを複数バッチ収集し、収集バッチに応じて訓練セットとテストセットを分割しました。各サイトのトレーニング セットには 13349 のサンプルが含まれ、テスト セットには 12314 のサンプルが含まれ、各 HRRP サンプルの次元は 256 次元です。さまざまなタイプのターゲットのトレーニング サンプルとテスト サンプルの数を表 3 に示します。

写真

表 3 データセットのサンプル分布

実験のすべてのメソッドは、単一の RTX 3090 グラフィックス カード上の Pytorch を使用して実装され、トレーニング損失関数はクロスエントロピー損失を使用し、オプティマイザーは AdamW[22] を使用し、初期学習率は 1E–3 に設定され、トレーニングラウンド数は 200 に設定されます。バッチ サイズは 64、サブシーケンス長 P は 32、入力コーディング次元 D は 128 に設定され、フロントレベルの特徴相互作用モジュールの主分岐の重み w11 、 w22 、および w33 は次のようになります。すべて 0.6 に設定され、他のブランチの重みは 0.2 に設定されます。 の関連パラメータ設定を表 4 に示します。

写真

表 4 実験パラメータの構成

3.2

写真

   実験結果と分析

多局協調認識シナリオにおける提案手法の有効性を評価するために、本論文では認識性能を比較するためにさまざまな手法を選択した。比較手法には、畳み込みニューラルネットワーク (CNN) モデルに基づく単一局認識手法、CNN ベースのデータ融合手法 [23]、CNN ベースの特徴融合手法 [24]、CNN ベースの決定融合手法 [25]、Transformer が含まれます。ベースの単一ステーション認識方法、Transformer ベースの特徴融合方法。このうち、CNN 単一局認識方式は 3 つの畳み込み層と 2 つの全接続層で構成され、3 つの畳み込み層のチャネル数はそれぞれ 8、16、32、畳み込みカーネル サイズは 1×5、ステップ サイズは 1 です。全結合層のニューロンの数は、それぞれ 512 と 5 です。CNN モデルに基づく多局協調認識法 単一局 CNN モデルに基づき、データ結合を入力とするデータ融合認識法、特徴結合を伴う特徴融合認識法、単一局で重み付けした判定融合認識法局予測確率はそれぞれ構築される。Transformer モデルに基づく単一ステーション認識方法では、3 層の Transformer 層を使用して特徴を抽出し、2 層の全結合層を使用して最終的な認識を行います。Transformer モデルに基づく特徴融合手法は、本論文のベースライン手法として、各ステーションの 3 番目の Transformer 層の出力特徴を結合します。すべてのメソッドは、同じデバイス上で同じハイパーパラメータ設定を使用して実行されます。表 5 は提案手法と他の手法の認識結果を比較したものである。

写真

表5 実験結果

表 5 から、本手法は対象の特徴を特徴付ける質の高い特徴を抽出でき、フロントレベルの特徴の相互作用と深い注目特徴を通じて各観測点の観測データの相補性を有効に活用できることがわかります。融合モジュールにより、最高の認識性能が得られ、認識率は 96.90% に達します。単一局認識手法のうち、CNN モデルに基づく単一局認識手法の最適認識率は 90.71%、Transformer に基づく単一局認識手法の最適認識率は 93.21% です。2 つの方法と比較して、この論文の方法はそれぞれ 6.19% と 3.69% 改善されました。単一ステーション認識手法と比較して、Transformer モデルは HRRP の局所構造情報に注意を払いながら HRRP のグローバル構造情報にも注意を払うことができるため、CNN モデルよりも優れた特徴表現能力を備えているため、認識率が向上します。 Transformer に基づく単一ステーション方式の方が対応する方式よりも優れており、CNN ベースの単一ステーション方式の認識率が優れています。多局協調認識法では、CNNモデルに基づく多局協調認識法は、決定融合を使用した場合に90.96%の最適認識率を達成し、Transformerモデルに基づく特徴融合法の認識率は93.60%でした。それぞれ 5.94% と 3.30% 増加しました。マルチステーションの協調認識結果を単一ステーションの認識結果と比較すると、マルチステーション協調認識方法が追加データからターゲットに関するより多くの情報を取得し、認識性能を効果的に向上できることがわかります。この論文の方法は、多段階の融合戦略を使用することによって、従来の融合方法の不十分な融合能力の問題をさらに改善し、認識性能の大幅な向上を得る。

表 5 に各手法のパラメータと計算量の比較も示します。本論文手法はCNNモデルに基づく多局融合手法に比べてパラメータ数が少なく、計算量も同等であるが、認識性能が大幅に向上しており、その優位性がさらに実証されているこの論文の方法の説明。

図 10 は、この論文の方法に対応するテスト混同行列です。この論文の方法は A320 と A321 に対して最も優れた認識性能を持ち、認識率はそれぞれ 99.77% と 99.79% であることがわかります。A350 の場合、認識率は 97.96% です。A330-2の場合、認識率は95.68%です。A330-3の認識性能は最悪で認識率91.64%。さらにクラス間の誤判定状況を観察すると、A330-2、A330-3、A350 の間には若干の誤判定が存在しており、表 2 からこれら 3 種類のターゲットの物理パラメータは比較的近いことがわかります。したがって、この部分の誤判断は主にターゲットの身体的特徴が似ていることによって引き起こされます。

写真

図 10 テストセット認識率混同行列 (%)

この論文の方法によって提案された特徴の分離可能性をさらに分析するために、t-SNE を使用して、正規化と位置合わせ後のテストセットの HRRP データとこの論文の方法によって抽出された特徴の 2 次元視覚化を実行します。図 11 に示すように、紙 [26,27]。図内の異なる色と異なる記号は、異なるタイプのターゲットを表します。本稿の方法で抽出した隠れ層特徴量は、二次元可視化グラフにおいてクラス内でのコンパクトな分布とクラス間の明確な境界の特徴を示しており、それと比較して各種タイプの分離性が大幅に向上していることがわかる。モデル加工前。

写真

図 11 テスト セット データの 2 次元 t-SNE 視覚化とこの論文の方法で提案された特徴

角度ベースのTransformer融合ネットワークの前処理プロセスでは、分割されたHRRPサブシーケンスの数Nを決定する必要がある。Nが大きいほどHRRP部分系列が分割され、対象の局所構造に着目する粒度が細かくなりますが、入力系列数の増加によりモデル学習の難易度や計算量が増加します。逆に、Nが小さいほど分割されるHRRP部分列の数が少なくなり、モデル計算に必要な計算量も少なくなりますが、対象となるHRRPの局所構造への注目の粒度が粗くなり、モデルの表現能力に影響を与えます。 。実際のアプリケーションでは、実験データに従って適切な N を選択できます。モデルの N 依存性を解析するために、2 から 128 までの HRRP 部分列の数を入力として設計し、認識率と計算量への影響をテストします。Nによる認識率と計算量の変化のグラフを図12に示します。N が大きすぎたり小さすぎたりすると、認識性能が大幅に低下します。N=8 の場合、モデルは比較的少ない計算量で最高の認識パフォーマンスを達成します。

写真

図12 HRRP部分列数による認識率と計算量のグラフ

本稿では,提案手法における各モジュールの認識性能への寄与を評価するため,前述のTransformer特徴融合法をベースライン手法として用い,ベースライン手法に各モジュールを段階的に追加してアブレーション実験を行った.アブレーション実験の結果を表 6 に示します。ベースライン手法の認識率は 93.60% です。角度ガイダンスモジュールをベースライン方法に追加すると、認識性能が0.90%向上しました。これは、提案された角度ガイダンスモジュールがターゲットの事前の角度を特徴抽出プロセスに効果的に組み込み、特徴を抽出するようにモデルを誘導できることを示しています。ターゲットの方位と一致します。フロントレベル特徴インタラクションモジュールのみを追加した場合、認識性能が0.40%低下しますが、これは、深い特徴融合を行わずにフロントレベル特徴インタラクションのみを実行すると、モデルが複数の入力間の補完情報を学習することが困難になるためです。 。ディープ アテンション特徴融合モジュールのみを追加した場合、認識パフォーマンスは 0.10% 向上し、アテンション メカニズムが特徴融合のパフォーマンスを向上できることを示しています。角度ガイダンスとフロントレベル特徴インタラクションモジュールを同時に追加すると、認識パフォーマンスは 0.17% 向上しますが、深い特徴融合がないため、認識パフォーマンスの向上には限界があります。フロントレベル特徴インタラクションモジュールとディープアテンション特徴融合モジュールを同時に追加すると、認識性能が0.87%向上しました。これは、フロントレベルを通じて他のレーダーエコー情報と自身のエコー情報の相関学習が行われることを示しています。特徴の相互作用は共同認識に有益です。角度ガイダンスと深い注意特徴融合モジュールを同時に追加すると、認識性能が 2.08% 向上し、角度ガイダンスと深い注意特徴融合モジュールの組み合わせの方がより良い効果があることを示しています。最後に、完全な角度ガイド付きトランス融合ネットワークの平均認識率は 96.90% であり、認識性能はベースラインと比較して 3.30% 向上しました。これは、提案された 3 つのモジュールが効果的に連携して認識性能の最大の向上を達成できることを示しています。

写真

表6 アブレーション実験結果

4. 結論

多局HRRP協調目標認識の問題を目指して,本論文は角度誘導変圧器融合ネットワークに基づく多局HRRP協調認識法を提案した。まず、各局の HRRP エコーが前処理されて、振幅感度と変換感度が除去されます。次に、Transformer モジュールを使用してモノスタティック エコー特徴を抽出し、角度ガイダンス モジュールを使用してモノスタティック特徴を強化します。次に、マルチステーションの特徴の多段階の階層的融合が、フロントレベルの特徴相互作用モジュールとディープアテンション特徴融合モジュールを通じて実行されます。最後に、多局協調目標認識結果が分類ヘッドを介して出力されます。測定データのシミュレーション結果は,この論文の方法がマルチステーションHRRPエコー特徴を効果的に融合できることを示した.角度誘導モジュール,フロントレベル特徴相互作用モジュールおよび深い注意特徴融合モジュールの有機的な組み合わせを通じて,従来の融合方式はもちろん、単体レーダーよりも優れた認識性能を得ることができます。最後に、この論文では、レーダー信号融合処理のレベルで複数ステーションの協調目標認識を簡単に分析しているだけであることに注意してください。また、干渉により一部のエコーが欠損した場合に、レーダ信号の融合処理をどのように行うかについても今後の課題となる。

免責事項:公式アカウントに転載された記事や写真は、参考や議論のための非営利の教育および科学研究を目的としたものであり、彼らの見解を支持したり、その内容の信頼性を確認したりするものではありません。著作権は原著作者に帰属しますので、転載原稿に著作権等の問題があった場合は、速やかに削除のご連絡をお願いします。

「人工知能技術とコンサルティング」をリリース

おすすめ

転載: blog.csdn.net/renhongxia1/article/details/132139848