ネットワーク インテリジェンス/コミュニケーション AI TOP10 研究の方向性とデータセット インベントリ

近年、人工知能技術の広範な応用と通信分野における技術の進化に伴い、両者の統合は避けられない傾向となり、トレーニングモデルの基礎となるデータセットが徐々に視野に入ってきています。研究者の数が増え、その重要性はますます高まっています。この記事では、ネットワークインテリジェンスの分野で研究の方向性トップ10と一般的に使用されているデータセットを紹介し、これらのデータセットは幅広い応用範囲とそれぞれのシナリオで重要な位置を占めており、研究者やエンジニアの参考になれば幸いです。そして助けてください。

無線チャネルのモデリングと予測

チャネルは物理層の中核の 1 つであり、その性能によって無線通信の伝送効率と安定性が決まります。したがって、無線通信システムの設計と最適化の基礎としての無線チャネルのモデリングと予測は、無線通信分野における重要な研究方向であり、技術研究開発における重要なリンクの 1 つです。5G 無線通信技術の急速な発展と応用に伴い、無線チャネルのモデリングと予測データセットに関する研究がますます注目を集めています。

無線チャネルのモデリングと予測データ セットは、フェージング特性、マルチパス伝播、チャネル容量、および伝播中の無線信号のその他の問題を研究し、チャネル内の無線信号の伝播特性を予測するために使用されます。これらのデータ セットには通常、信号強度、位相、遅延などの情報と、地理的位置、アンテナ構成、周波数などの対応するメタデータが含まれています。データ セットには、測定データ、シミュレート データ、または公開データ セットがあり、これらは無線チャネル モデルのトレーニングとテスト、モデルのパフォーマンスの評価、新しい無線通信技術とアルゴリズムの開発に使用され、それによって無線通信システムの設計と最適化をより深く理解して最適化するのに役立ちます。パフォーマンス。

現在、多くの企業や研究機関がワイヤレス チャネルのモデリングと予測に関する研究に多大なリソースを投資しており、一部の公開データ セットは常にリリースおよび更新されています。いくつかのよく知られた公開データセットには、研究者に貴重なデータリソースを提供するIEEE 802.11adチャネル測定データセット、チャネルSENSEDなどが含まれ、無線チャネルモデリングおよび予測データセットの開発と応用は、無線通信の進歩と発展を促進します。技術。

- 代表论著者:深層学習ベースの自動変調分類: 包括的なレビュー (Wang et al., 2020)

適応変調とコーディング

Adaptive Modulation andcoding (AMC) は、物理層に基づくリンク アダプテーション技術であり、主に無線リンクの変調モードと符号化率を調整することでリンクの伝送品質を保証します。チャネル状態が悪い場合、システムはより小さい変調方式と符号化率を選択し、チャネル状態が良好な場合、システムはより大きな変調方式を選択して伝送速度を最大化します。調整プロセス中、システムは、ワイヤレス チャネルの送信容量の利用率を最大化するために、送信データ レートがチャネル変動傾向と一致することを常に望んでいます。特に 5G 時代では、伝送速度の高速化とスペクトル利用要件の増大により、適応変調および符号化技術に対する研究の熱意がさらに高まっています。

適応変調および符号化データ セットには、通常、チャネル品質表示 (CQI)、プリコーディング マトリックス表示 (PMI)、ランク表示 (RI) などの情報の測定とフィードバックが含まれます。この情報は、アップリンクおよびダウンリンク チャネルで適応変調とコーディングを実装するために使用されます。さまざまなチャネル条件下でテストすることで、研究者はさまざまなシナリオでのさまざまな変調方式と符号化率の組み合わせの伝送パフォーマンスを評価および比較でき、実際のアプリケーションの参考資料となります。

- 代表论著 :機械学習技術を使用したコグニティブ無線ネットワークにおける適応変調とコーディング(Singh,et.al,2018)

エッジコンピューティングとエッジインテリジェンス

5G テクノロジーが徐々に成熟し商用化されるにつれ、エッジ コンピューティングとエッジ インテリジェンスが将来の開発トレンドになるでしょう。エッジ コンピューティングとエッジ インテリジェンスは 2 つの関連する技術分野であり、データ処理効率の向上と遅延の削減というさまざまなリアルタイム アプリケーションのニーズを満たすために、どちらもテストと評価に大規模なデータ セットを必要とします。

エッジ コンピューティングは、データの送信元ノードでデータを処理するテクノロジーですが、エッジ インテリジェンスは、データ分析、機械学習、または人工知能をエッジ コンピューティング アーキテクチャに適用するワークロードです。エッジ コンピューティング データ セットは、通常、モノのインターネット デバイス、ローカル端末デバイス、エッジ サーバーなど、現実世界のさまざまなセンサーやデバイスから取得されます。エッジ コンピューティング アーキテクチャのパフォーマンスと効率を評価するために使用されます。たとえば、エッジ コンピューティング デバイスのデータ処理能力、遅延、エネルギー消費、その他の指標をテストします。しかし、この情報を入手し、既存の技術条件下で効果的に統合することは依然として困難です。エッジ インテリジェンス データ セットは通常、実際のアプリケーション シナリオでさまざまなデータ特徴とラベルを含む必要があり、主にエッジ コンピューティング アーキテクチャで人工知能アルゴリズムとフレームワークを適用する実現可能性とパフォーマンスを評価するために使用されます。これらのデータセットは、エッジ コンピューティングとエッジ インテリジェンスの研究とアプリケーションのニーズを満たすように設計されており、これらのデータセットのテストと評価を通じて、エッジ コンピューティングとエッジ インテリジェンスのパフォーマンスと効率を継続的に改善できます。

- 代表著者:「モバイル エッジ コンピューティング ネットワークのための AI 主導の計算オフロード スキーム」Xianfu Chen et.al. (西南交通大学)。

ネットワークトラフィック分析とトポロジーの最適化

ネットワーク トラフィックの分析と最適化は、通信ネットワークの重要な研究方向であり、その目的は、ネットワーク トラフィックの分析と最適化を通じてネットワークのパフォーマンスと信頼性を向上させることです。情報技術の急速な発展と普及に伴い、ネットワークトラフィック分析と最適化データセットの研究と応用も急速な発展傾向を示しており、研究の熱意はますます高まっています。

ネットワーク トラフィック分析および最適化データ セットには、通常、HTTP、FTP、電子メール、オンライン ビデオなど、実際のネットワーク環境におけるさまざまなトラフィック特性や通信動作を含む、ネットワーク トラフィック ログ、ネットワーク トラフィック統計、ネットワーク トラフィック ミラーリングなどが含まれます。これらのデータセットの分析とマイニングを通じて、ネットワークトラフィックの統計的特徴、通信パターン、異常状態などの情報を取得し、ネットワークパフォーマンスをリアルタイムで監視したり、ネットワーク攻撃や異常動作を発見したり、ネットワーク障害を発見したりできます。を診断し、ネットワークのセキュリティと信頼性を向上させることができます。同時に、ネットワーク トラフィック データの分析とモデリングを通じて、ネットワーク計画とリソース割り当てを最適化し、ネットワークの効率と利用率を向上させることもできます。

現在、国内外の多くの大学、研究機関、企業は、ネットワークトラフィックの分析と最適化データセットに関する広範な研究と応用実践を実施しており、ネットワークパフォーマンスや伝送効率などの側面は非常に重要です。

- 代表论著 :LTEネットワークのネットワークパフォーマンスの分析と最適化:データ駆動型アプローチ(2018)

障害の認識と障害の場所

クラウドコンピューティングの普及とビッグデータ技術の急速な発展に伴い、ネットワークの規模は徐々に拡大し、ネットワークの動作は徐々に複雑化しており、ネットワーク障害の迅速な検出と位置特定の需要がますます高まっています。 。ネットワーク障害はユーザー エクスペリエンスとネットワーク運用に大きな影響を与えるため、多くの企業や組織は、ネットワーク障害の認識と位置の研究と応用に多大なリソースと人的資源を投資しており、これにより障害の認識と障害位置のデータも促進されています。セットの熱い展開。

障害認識および障害位置データ セットには、通常、ネットワーク デバイスのタイプ、デバイスの動作ステータス、障害時間とデバイス、障害レベルと原因などが含まれます。このようなデータセットを分析および処理することにより、研究者や最前線の運用および保守担当者は、異常や障害のルールと特徴を発見し、考えられる原因を推測し、さらに正確で効率的かつインテリジェントな障害認識モデルと根本原因分析アルゴリズムを確立できます。 、高速かつ正確なネットワーク機器またはシステムの障害検出を実現し、障害の原因を特定し、システムの安定、安全、信頼性の高い動作を保証します。

- 代表论著者 :大規模システムの時間的ログ解析と障害位置特定 (Daniel Sanchez,et.al,2019)

ネットワークリソースの管理/割り当ての最適化

ネットワーク リソース管理/割り当ての最適化データセットは、主にネットワーク通信分野におけるリソース管理と割り当ての最適化の問題を扱います。このようなデータ セットには通常、ネットワーク トポロジ、ノード情報、通信負荷、トラフィック特性、その他のデータが含まれており、これらのデータはネットワーク リソース管理のパフォーマンスを評価し、ネットワーク リソース割り当て戦略を最適化するために使用されます。このタイプのデータ セットには幅広い用途があります。たとえば、ネットワーク ルーティングの分野では、ルーティング アルゴリズムのパフォーマンスを評価し、ルーティング戦略を最適化するために使用できます。また、クラウド コンピューティングの分野では、次の目的で使用できます。仮想マシンのスケジューリングとネットワーク トポロジ制御戦略を最適化します。モノのインターネットの分野では、ノードの連携やネットワーク リソース割り当て戦略などの最適化に使用できます。ビッグデータ技術の幅広い応用も、そのようなデータセットの処理と分析を強力にサポートします。大量のネットワーク データの収集、保存、分析を通じて、ネットワーク リソースの管理と最適化戦略の策定に役立つ多くの貴重な洞察を得ることができます。

現在、UC Irvine によって開発された INCASE データセットは、ネットワーク リソース管理/割り当て最適化のためのオープンソース データセットであり、さまざまなネットワーク シナリオおよびパラメーター構成の下でのネットワーク パフォーマンス データが含まれており、研究者に優れた研究および実験プラットフォームを提供します。ネットワーク インテリジェンス テクノロジの継続的な開発とアプリケーション要件の継続的な増加に伴い、ネットワーク リソース管理/割り当て最適化データ セットの研究と応用の可能性もさらに広がるでしょう。

- 代表著者:「深層強化学習を使用した異種セルラーネットワークのリソース管理」Nidhi Hegde et.al.(インド工科大学ボンベイ校)。

大規模アンテナ (MIMO) のプリコーディングとデコーディング

無線通信技術の急速な発展に伴い、大規模 MIMO 技術は徐々に 5G 通信ネットワークの主要技術の 1 つとなり、大規模 MIMO システムではプリコーディングおよびデコーディング技術が重要な役割を果たしています。データセットの解読は大きな注目を集めています。さらに、大規模MIMOシステムの複雑さと実用化の要件により、大量のデータと複雑な信号処理アルゴリズムを処理する必要があり、これも関連データセットの開発と研究熱意の増大を促進します。

Massive MIMO プリコーディングおよびデコーディング データセットは、大規模な複数入力複数出力無線通信システムのプリコーディングおよびデコーディング アルゴリズムの評価と最適化のためのデータセットのクラスです。これらは主に、大規模 MIMO システムのプリコーディングおよびデコーディング アルゴリズムの評価、テスト、比較に使用されます。プリコーディング データセットに加えて、大規模 MIMO デコーディング データセットも大きな注目を集めています。Massive MIMO システムでは、チャネル フェージングやノイズの影響により、受信機は高度な信号処理アルゴリズムを使用して元の信号を復元する必要があります。したがって、大規模 MIMO デコーディング データセットは、主に、MMSE、ターボ デコーディング、反復デコーディングなどのさまざまな信号処理アルゴリズムのパフォーマンスを評価し、最適化するために使用されます。

つまり、Massive MIMOのプリコーディングおよびデコーディングデータセットは、5G通信分野で非常に重要なデータセットの1つであり、その内容はMassive MIMO技術の理論、実装、原理プロトタイプをカバーしています。関連するデータセットの開発と研究は、無線通信技術の進歩と応用にとって非常に重要です。

- 代表论著 :低複雑性のユーザーペアリングによる効率的な大規模マルチユーザーMIMOプリコードデータ送信(Wei Da,et.al,2021)

時空間シーケンスの予測

時系列/時空間予測データセットとは、通常、将来の傾向やイベントを予測するために使用される、時系列または空間系列データを含むコレクションを指します。気温、気圧、風速、電力消費量、住宅価格、株価など、さまざまな種類の測定データが含まれています。例えば、気象分野では将来の気象状況の予測、交通分野では交通流状況の予測などに活用できます。この幅広い用途により、時間/時空間予測データセットが現在の研究のホットスポットの 1 つになっています。この予測機能は、人々がリソースをより適切に計画および管理し、より多くの情報に基づいた意思決定を行うのに役立つため、多くの業界や分野にとって重要です。

時系列/時空間予測データセットは、機械学習および深層学習アルゴリズムの重要な応用分野の 1 つであり、LSTM、CNN、RNN などのさまざまな機械学習アルゴリズムや深層学習モデルを使用して処理および分析できます。近年、研究者らは、予測精度と汎化能力を向上させるために、アンサンブル学習や敵対的生成ネットワークなど、時系列予測データセットに基づく一連の新しいモデルや手法を提案しています。一般的な時系列/時空間予測データセットには、M4 チャレンジデータセット、エネルギー分解データセット、PGMDC データセット、タクシー軌跡データセット、住宅価格予測データセット、電気価格予測データセット、株価予測データセット、気温予測データが含まれます。交通流予測データセットなど これらのデータセットにはさまざまな特性と用途がありますが、いずれも時間/時空間予測の分野における研究に重要なデータ基盤と課題を提供します。

- 代表论著者:「屋外温度時系列からの転移学習による電気負荷の予測」、Chao Chen et al. (2020)

CSI チャネルのフィードバックと圧縮

Massive MIMO は、5G の主要な研究技術として、高いシステム容量と高いリンク信頼性という利点により多くの注目を集めていますが、Massive MIMO システムのより優れた空間多重とダイバーシティ利得を得るために、基地局は正確なダウンリンクを取得する必要があります。プリコーディングのためのチャネル状態情報。システム帯域幅と MIMO アンテナの数の増加に伴い、CSI の次元は指数関数的に増加します。一方、従来のコードブックベースの CSI フィードバック方法は、高い計算の複雑さ、大容量などの要因により、システムの伝送効率と能力に重大な影響を与えます。ストレージのオーバーヘッド。したがって、効果的な CSI 圧縮フィードバック方法により、大規模 MIMO システムの効率的な動作とシステム ゲインを確保できます。

AI ベースの CSI 圧縮フィードバック テクノロジーに関する最近の研究では、非線形の問題や課題を解決するために AI テクノロジーを適用することがますます普及し、CSI フィードバック圧縮の品質とフィードバック送信の精度を向上させ、また、効率的に負荷を削減できることが示されています。 CSIの操作時間。一般的な CSI 圧縮フィードバック アルゴリズムには、圧縮センシングに基づく CSI フィードバック アルゴリズム、深層学習に基づく CSI フィードバック アルゴリズムなどが含まれます。CSI 圧縮フィードバック データ セットは、AI ベースの CSI 圧縮フィードバックのデータ基盤を提供します。データ セットの構築は、シミュレーションを通じて構築することも、ライブ ネットワーク上で収集することもできます。シミュレートされたデータ セットは、チャネル モデリングを通じて理論的シナリオでチャネル データを生成します。データはライブ ネットワーク上で収集され、セットはより複雑、ランダム、そして多様になります。高品質のデータ セットは、さまざまなチャネル シナリオ、さまざまな送信アンテナ数、さまざまなシステム帯域幅構成などを満たす必要があります。豊富なデータ セットにより、AI モデルの一般化が向上します。

現在、主要な研究機関は、CSI 圧縮フィードバック技術の開発と実装を促進するために、さまざまな CSI チャネル フィードバック圧縮データ セットの開発と適用に取り組んでいます。研究者はシミュレーション手法を使用して、さまざまなシナリオおよびさまざまなパラメータ構成の下でチャネル データを構築し、AI アルゴリズムのパフォーマンスを検証し、継続的に最適化することができます。同時に、研究者らは、ライブネットワークの実際のシーンのチャネルデータに基づいて、CSI圧縮フィードバック技術の性能検証を実行しました。

- 代表论著 :Compressed Channel Sensing: An Introduction of State-of-the-Art Algorithms and Applications (Jie Zhang,et.al,2020)

無線リソースのスケジューリングと意思決定

5G 技術の普及と将来の無線通信技術の発展に伴い、無線リソースのスケジューリングと意思決定は重要な技術の 1 つになりました。マルチユーザー、マルチセル、マルチバンドの通信システムでは、限られた無線リソースをスケジューリングと意思決定にどのように効率的に使用するかが、通信システム全体のパフォーマンスと効率に直接関係します。たとえば、無線をどのように割り当てるかが重要です。チャネルとユーザー スケジューリングの実行方法、レート割り当ての実行方法など。これらの問題には大量の実験データとアルゴリズムのサポートが必要なため、無線リソースのスケジューリングと意思決定データセットの研究と応用が大きな注目を集めています。

無線リソースのスケジューリングおよび意思決定のデータセットには、通常、チャネル状態情報、ユーザーの位置情報、伝送速度など、実際の通信システムからの測定データが含まれており、研究者が実験や分析を行うためのさまざまなシナリオやパラメータ構成が含まれています。無線通信システムにおける無線リソースのスケジューリングと意思決定アルゴリズムを評価し、最適化します。これらのデータセットを使用することで、研究者はアルゴリズムの実験を実施し、さまざまなアルゴリズムのパフォーマンスと効率を比較して、より良いスケジューリングと意思決定の戦略を見つけることができます。無線リソースのスケジューリングと意思決定の目的は、通信システム全体のパフォーマンスと効率を最適化することです。たとえば、システムのスループットを最大化し、伝送遅延を最小化し、ユーザーの満足度を最大化するために、無線リソースを割り当ててスケジュールする方法などです。

- 代表著:「部分チャネル知識を備えたダウンリンクセルラーネットワークの分散リソース割り当て: 凸型最適化アプローチ」M. Bennis、S. Oudheusden、および HV Poor 著、IEEE Transactions on Communications、2018 年。

上記は、ネットワーク インテリジェンスの分野で一般的に使用されている上位 10 個のデータ セットです。これらはすべて、幅広い用途に使用され、それぞれのフィールド シナリオで重要な位置を占めています。参考にしていただければ幸いです。もちろん、分野ごとにデータセットの適用シナリオは異なるため、特定のニーズに基づいて適切なデータセットを選択する必要があります。ネットワーク インテリジェンス テクノロジの継続的な開発により、さまざまな分野でのネットワーク インテリジェンスの応用と開発を促進するために、さらに多くの新しいデータ セットが出現し続けると考えられています。

おすすめ

転載: blog.csdn.net/TELCOM17AI4NET/article/details/131119515
おすすめ