【2021年時空間AI白書】時空間人工知能:キーテクノロジー

1. 主要技術

ビッグデータのアプリケーションには、収集、アクセス、保存、管理、分析などの多くのプロセス リンクが含まれており、各プロセス リンクには選択すべき多くの技術的ルートと実装フレームワークがあります。これらの技術とフレームワークを重ね合わせ、統合することで時空間ビッグデータ技術システムが構成され、複数種類の時空間ビッグデータの応用をサポートします。

(1) データ アクセス層は主にデータの入り口として機能し、時空間ビッグ データへのアクセスとキャッシュ、および下流システムによる消費を担当します。

(2) データストレージおよび管理プラットフォームは、時空間ビッグデータのストレージを担当し、対応するインデックスインターフェイスを組織し、アクセスモードに応じて、分散ファイルシステムタイプと非リレーショナルデータベースタイプの 2 つのカテゴリに分類できます。ファイル システム タイプは主に大規模なデータ ボリュームの集計分析シナリオに使用され、非リレーショナル データベースは主にさまざまな種類のデータの正確なクエリに使用されます。

(3) データ処理および分析プラットフォームは、基本的なクエリ アクセス インターフェイスの提供に加えて、さらに高性能な分析メソッドを提供し、データの存在形式とアプリケーション シナリオに応じて、バッチ処理用のオフライン データ分析とリアルタイム データ分析に分けられます。ストリーム処理のためのストリームコンピューティング。

(4) アプリケーション層は、必要に応じてクエリ/処理層のアクセスインターフェースや計算解析操作を直接呼び出したり、二次開発を通じて関連メソッドを組み合わせたりして、時空間ビッグデータの高次アプリケーションをサポートします。

1.1 時空間ビッグデータ

時間と位置のラベルが付いたデータは日常生活で非常に一般的であり、人間の生活で生成されるデータの約 80% は時空間位置に関連しています。2011 年、マッキンゼー グローバル インスティテュート マニカらは、「ビッグデータ: イノベーション、競争、生産性の次のフロンティア」というレポートを発表し、そのレポートでは、データを 5 つの主要なカテゴリ (ヘルスケア、小売、公共部門、製造、個人) に分類すると提案しました。位置情報は、大幅に地理コード化され、時間タグが付けられている現在の主要なビッグ データ ストリームを構成します。

1.1.1 時空間ビッグデータの特徴

インターネット、モノのインターネット、クラウドコンピューティングの急速な発展に伴い、データ取得手法は多様な方向に発展し、データの種類も多様化し続けており、時空間関連データは「爆発的」増加傾向にあり、時空間情報とビッグデータの統合 本格的に時空間ビッグデータの時代を迎えます。時空間ビッグデータは、量、多様性、速度、価値の「4V」特性を持つと認識されています。さらに、以下の 4 点を含む、オブジェクト/イベントの豊富な意味特性と時空間次元での動的な相関特性も備えています。

(1) 時空間ビッグデータの要素にはオブジェクト、プロセス、イベントなどが含まれ、これらの要素には空間、時間、セマンティクスなどの制約が関連付けられています。

(2)時空間ビッグデータは、時空間における動的な進化特性を有しており、時空間ビッグデータ要素に基づくこれらの時空間変化を測定することができる。

(3) 時空間ビッグデータにはスケール特性があり、スケールサイズ、サンプリング粒度、データ単位分割の詳細レベルに応じて、時空間ビッグデータのマルチスケール表現・解析モデルを構築することができる。

1.1.2 ビッグデータの時空間分類

時空間ビッグデータは、物体をセンシングする観点から、地理的環境を認識する時空間ビッグデータと、人間の社会活動を認識する時空間ビッグデータに分けられる。地球観測技術の発展に伴い、さまざまな種類のリモートセンシングデータが指数関数的に増加し、徐々に蓄積され、典型的な時空間ビッグデータ、すなわち「リモートセンシングビッグデータ」となってきました。インターネット技術とソーシャルメディアプラットフォームの継続的な開発と進歩に伴い、人間の活動は、モバイル軌跡データ、ソーシャルメディアデータ、買い物注文データ、モバイルデータなど、位置座標と時間タグを含む大量の時空間データを毎秒生成します。電話情報 データをお待ちください。これらのデータは人間の日常生活を記録し、人間の活動の潜在的な法則を含んでいます。これらのデータは前例のない速度と規模で増加し蓄積されており、合理的、効率的かつ完全にマイニングして適用することが緊急に必要です。

1.1.3 ビッグデータ管理

時空間データの効率的な管理は、時空間ビッグ データのリアルタイムで包括的かつ体系的な分析と計算の基礎です。時空間データは非構造化の特徴を持っており、データ項目が可変で、データ長が長くなり、レコードが入れ子になっている場合もあるため、効率的なビッグデータ管理ソリューションには、大規模な時空間データを効果的に整理する一方で、テーブルをサポートする必要があります。もう一方は構造化された組織であり、非構造化データを管理します。

ビッグデータ管理の主要なテクノロジーには、時空間インデックス作成とコーディング、時空間の不均衡なデータに適応する負荷分散、効率的なクエリ取得、管理プラットフォーム テクノロジーなどが含まれます。

時空間ビッグデータ総合管理プラットフォームは、データ管理プラットフォームと時空間データストレージソリューションに基づいて構築され、時空間ビッグデータ環境への効率的なアクセスと多次元インデックス作成の特性を組み合わせています。ほとんどの時空間データ ストレージ管理ソリューションは、ファイル レベルの管理プラットフォームとデータベース レベルの管理プラットフォームに基づいて設計されています。

1.1.4 ビッグデータ解析

時空間ビッグデータ分析とは、時空間ビッグデータにさまざまな分析およびマイニングモデルを適用して、複雑な地理法則を理解するために重要である、地理データにおける潜在的で貴重な時空間パターン、相関関係、およびそれらの経時的進化傾向を発見することです。現在、ビッグデータの主要な時空間分析手法は、時空間クラスター分析、時空間異常分析、時空間相関分析、時空間予測分析の 4 つのカテゴリに分類されます。

(1) 時空間クラスター分析

時空間クラスター分析は、地理的空間におけるさまざまな実体の時空間分布パターンと規則性を発見することを目的としています。これは、地理的実体または地理的現象の本質的な特性、相互依存性、進化傾向を明らかにするための重要な指針となります。クラスタリング手法が非空間テーマ属性を考慮するかどうかに応じて、現在の時空間クラスタ分析手法は、時空間位置クラスタリングと非空間テーマ属性を考慮する時空間クラスタリングの 2 つのカテゴリに分類できます。

(2) 時空間異常の解析

時空間異常解析の目的は、大規模な時空間データベースから全体的または局所的な分布特性から逸脱する少数の実体をマイニングし、地理的分布の特殊な条件、変化、または潜在的な発展パターンを詳細に分析するための重要な理論的基礎と実用的な指針を提供することです。現象または地理的プロセス。時空間異常分析は、時空間データの相関性、異質性、非定常性、その他の特性をさらに考慮した、空間ドメインおよび時空間ドメインにおけるトランザクション異常検出の拡張とみなすことができます。時空間異常解析は、位置、時間、属性の組み合わせ関係により、位置ベースの空間異常検出、位置属性ベースの空間異常検出、位置時間ベースの時空間軌跡異常検出、位置ベースの空間異常検出 時間属性の時空間シーケンス異常検出

(3) 時空相関解析

時空間相関分析は、時空間データ セットから地理的エンティティの異なるカテゴリ間で特定の時空間相関 (時空間的近接関係など) を頻繁に持つエンティティ カテゴリのセットを特定することを目的とし、地理的エンティティ間の時空間相互作用を理解する上で非常に科学的意義があります。その中で、連続的な時間/空間領域を離散的に分割することにより、隣接する時空間位置にあるデータ間の潜在的な時空間関係が分離されるため、Shekhar らは、頻繁に一致する地理的特徴を発見するための非トランザクション モデルを初めて提案しました。 - 連続した空間ドメイン内の隣接する空間位置で発生するエンティティの集合 (空間的ホモロケーション パターンと呼ばれる)。現在、関連する学者は主に、空間領域から時空領域への拡張、ユークリッド空間からネットワーク空間への拡張、グローバルモデルからローカルモデルへの拡張という3つの側面で詳細な研究を行っている。

(4) 時空予測解析

時空間予測とは、時空間変数間の関係を反映したモデルを構築することにより、地理的事象や現象の未知の空間属性値やテーマ属性値を推定することです。分析理論の違いに応じて、時空間予測モデルは時空間統計モデルと機械学習モデルに分類できます。このうち、時空間統計モデルは、(時間)空間依存性を扱う地球統計モデルや時空間自己回帰移動平均モデルなど、統計的推論を通じて変数間の関係を記述するものや、(時間)空間を非現実的に表現する地理加重回帰モデルなどがあります。 -定常性、地理的時空間加重回帰モデルなど 時空間統計モデルと比較して、機械学習モデルはあらゆる複雑な非線形関係を適応的にモデル化でき、近年時空間予測分析に広く使用されています。ベクター マシン、デシジョン ツリー、ニューラル ネットワーク、ディープ ニューラル ネットワークなど。

1.2 ビッグデータコンピューティング

時空間ビッグデータコンピューティングとは、時空間ビッグデータの収集、アクセス、保存、管理、分析などのさまざまなプロセスリンクで時空間ビッグデータを処理するためのコンピューティング手法、技術の選択、実装フレームワーク、パフォーマンス分析などの総称です。これらの計算の一部はデータの並べ替え、準備、ビッグ データのストリーミング用、一部は計算結果の定期的な統合と視覚化用、一部のアルゴリズムはコンピューティングの高速化用、一部はストリーミング時空間データに基づく機械学習モデルです。確認と申請。

1.2.1 グリッド空間化に基づくビッグデータコンピューティングフレームワーク

ビッグデータコンピューティングは、一般に地理座標系の球面グリッド、または時空間セグメンテーション用の多面体セグメンテーションに基づく球面グリッドに基づいており、動的調整をサポートするバランスツリーインデックスまたは静的空間分割に基づくハッシュインデックスを使用して大規模なデータをインデックスします。時空間データ。インデックスとデータの特性、および管理プラットフォームの特性に基づいて時空間データのエンコード スキームを設計し、時空間範囲クエリや時空間最近傍クエリなどの時空間クエリ アルゴリズムを最適化します。

グリッド セグメンテーションのフレームワークに基づいて、時空間データの属性が各グリッドに空間化され、構造化された時空間データ配列が構築されます。リモート センシング画像は自然なグリッド データであるため、機械学習フレームワークの構築が非常に簡単になります。

1.2.2 時空間ビッグデータの分散コンピューティング

ビッグデータの時空間データの量、種類、保存モードの変化が大きいため、従来の一元的な時空間分析プラットフォームとシリアル アルゴリズムには大きな制限があり、実際のアプリケーションの規模と効率の要件を満たすことが困難です。分散並列テクノロジーは、クラスター アーキテクチャ リソースの利点を最大限に活用し、コンピューティング分析タスクをいくつかのサブタスクに分解し、それらをコンピューター クラスターに分散して処理することで、コンピューティングのスループットとコンピューティング効率を大幅に向上させます。従来の時空間解析アルゴリズムのほとんどは、集中型の単一マシン アルゴリズムでしたが、それらを分散並列に拡張することで、コンピューター クラスターを使用して、ビッグ データの高性能コンピューティングと解析タスクを完了できます。

ビッグ データ コンピューティングは通常、分散コンピューティング プラットフォームに基づいており、MapReduce、DAG コンピューティング モデル、データ パーティションの負荷分散、分散インデックスなどの主要なテクノロジを使用して、ビッグ データ分析のコンピューティング効率を向上させます。分散時空間ビッグデータ分析の実装には主に 4 つのステップが含まれます: 時空間近接性に基づくデータ分割と負荷分散、分散 2 レベル時空間インデックスの構築、効率的な空間リレーショナル コンピューティング ライブラリの実装、SQL 言語の拡張時空間述語。

1.2.3 時空間データフローの計算

時空間データ ストリームはリアルタイムで生成され、適時性の価値が高く、物流流通、車両と乗客のマッチング、指標の監視などに幅広い応用シナリオがあります。静的な時空間データの処理とは異なり、時空間データの流れは徐々に到達する、無秩序、不均一な時空間分布、および将来の状況を予測することが困難であるという特徴を持っています。時空間データ フローの計算には、ステータス、タイム ウィンドウ、フォールト トレランスなどの一連のテクノロジのサポートが必要です。

リアルタイム時空間コンピューティングは通常、既存の分散ストリーム処理エンジンを使用して時空間データ ストリームを効率的に処理し、時空間データ ストリームの適時性の価値を最大限に活用します。リアルタイムの時空間コンピューティングは現在の技術フロンティアであり、すでにいくつかのネイティブ ストリーム データ処理エンジンがあり、イベント駆動型アプリケーションや ETL などで広く使用されており、低遅延、高スループットの利点が証明されています。ストリーミング コンピューティングの現在の業界標準として機能します。ただし、ストリーム処理エンジンの時空間的なスケーリングは、学術界でも産業界でもまだ比較的未熟です。

1.3 時空間知識グラフ

時空間知識グラフは、単なる「強化された」オープン ドメイン知識グラフではなく、ビジネス シナリオとドメイン知識を組み合わせる必要があり、時空間知識自体の特性に基づいて、知識の概念、エンティティ、および関係を意味論的および時空間的に拡張します。時空間知識グラフでは、意味関係の記述に加えて、空間関係と時間関係の記述も考慮する必要があり、時空間関係と意味関係のマッピングをどのように確立するかが、時空間知識の構築における重要な問題となります。グラフ。

時空間知識グラフの構築は、時空間知識の抽出、時空間知識の融合と関連付け、時空間知識の推論と計算、時空間知識シナリオの適用の基本プロセスに従います。大規模な構造化、半構造化、非構造化の時空間データからエンティティ、関係、属性に関する情報を抽出し、エンティティのアライメントと参照解決を通じて時空間データの知識融合を実現し、知識を知識ベースに保存します。推論、計算、グラフのアプリケーション。

1.3.1 時空間知識の抽出

時空間知識抽出は、大規模な時空間知識グラフを構築する上で重要な部分です。その目的は、マルチソースの異種時空間データからエンティティ、関係性、属性などの知識要素を自動的に抽出し、それらをトリプルに編成して保存することです。ナレッジグラフの真ん中。時空間データは、ストレージの種類に応じて、構造化データ、半構造化データ、非構造化データに分類できます。データ ソースの種類が異なれば、知識抽出に必要な主要テクノロジーも異なります。構造化データ (地図、地名データベースなど) の場合、データベース内の概念とナレッジ グラフ内のオントロジーとの間のマッピング関係とルールベースの推論を確立することにより、空間エンティティ、属性、およびそれらの関係がデータから自動的に抽出されます。データベース、半構造化データ (Web サイト上のテーブルやリスト データなど) の場合は、対応するテンプレート抽出機能を確立して知識抽出を実装できます。非構造化データ (Web ページのテキストまたはその他のテキスト情報、WeChat、Weibo、写真、など)、既存のデータを主に使用できます。ナレッジグラフの知識に基づいて、遠隔監視を通じてトレーニングセットを構築し、深層学習手法を使用して抽出器を学習して知識抽出を実行します。

豊富な時空間意味情報を含むオンライン テキストの爆発的な増加と自然言語処理技術の急速な発展により、オンライン テキストからの時空間知識の抽出が注目の 1 つとなっています。深層学習は、他の機械学習手法に比べてコーパスへの依存度が大幅に低く、深層構造の文脈上の特徴を自動的に学習し、地理的エンティティ、時間情報、空間情報、属性抽出、関係抽出に関して大量のテキストからより良い結果を得ることができます。時空間知識のパフォーマンスとタイムリーな更新は、動的な時空間知識グラフを構築する重要な方法となっています。また、時空間データには、地図、画像、軌跡などの異質なデータが多数含まれることが多く、知識を得る際には、データをさらに分析・変換したり、地図記号の時空間的な意味を理解したり、さまざまな種類の地図記号を識別したりする必要があります。時間、空間、そして時間と空間の関係。

1.3.2 時空間知識の統合と相関

複数政府間のデータ、時空間基礎データ、ネットワークデータ、ドメインデータなど、膨大な時空間知識のソースは数多く存在しており、時空間データの効率的な統合と関連付けを実現することで、データの価値を最大限に活用し、コストを削減することができます。時空間ビッグデータ活用システムの構築コストの削減やスペースの改善など、データ利用の効率化は実用上重要な意味を持ちます。

さまざまなデータ ソースからの時空間知識の記述には、情報の冗長性や一貫性の問題 (一貫性のない分類システム、地理空間エンティティのあいまいさ、さまざまな特徴の説明の詳細、競合するエンティティの関係など) など、特定の相補性と相違点が存在します。知識融合とは、異なるデータ内の異なる識別されたエンティティの意味理解を同じエンティティに関連付けて、同じ名前、複数の名前、略語などの複数のエンティティのセマンティクスの曖昧さの排除と相互参照の解決を達成することであり、問​​題を解決する効果的な方法です。異種知識グラフの。時空間知識の融合には、パターン層(概念層)と実体層の融合が含まれる。モデル層の融合は主に、地理空間オントロジー ライブラリの地理オントロジー知識の拡張と、新旧のオントロジーの融合に基づいており、エンティティ層の融合には、エンティティの参照、属性、関係、カテゴリなどが含まれます。 . 、主にインスタンスと関係の間の競合を回避するために、不必要な冗長性が主にエンティティ リンク テクノロジを使用します。さらに、論理的推論や知識発見などの技術に基づいて、純粋な地理空間情報は、時空間データ生成のプロセス、つまりセマンティックタグ拡張のプロセスに反映されるユーザーの行動、ステータス、好みなどのセマンティック情報で強化され、逆に外部純粋な意味情報は時間と空間に関連付けることもできます。

1.3.3 時空知識の推論と計算

知識推論とは、既知の事実または知識に基づいて未知の事実または知識を推論するプロセスを指します。ナレッジ グラフでは、推論は主にナレッジ グラフを完成させ、ナレッジ グラフの品質を検証するために使用されます。ナレッジ グラフで一般的に使用されるオントロジー推論、ルール推論、常識推論機能に加えて、時空間ナレッジ グラフには時間推論機能と空間推論機能もあります。時間的推論は、ターゲットクエリを時間制約で補完することができるため、推論結果が時間要件を満たすようになります。つまり、変数が時間的オブジェクトを表し、変数間の制約が時間的関係に対応する制約充足問題とみなすことができます。オブジェクトの間。時間的推論と同様に、空間的推論のプロセスでは、複数の空間オブジェクトと空間に埋め込まれたオブジェクトの属性を理解することができます。空間的推論には、トポロジー、方向、距離などの複数の空間関係の推論が含まれます。

グラフ データには豊富な構造情報が含まれており、データの固有の相関によって生成される非線形構造に本質的に対応します。表現学習とは、ニューラル ネットワークを通じてグラフの位相構造、ノード属性、ノード ラベルの特徴を非線形にマッピングし、より深い層でより高いレベルの特徴表現を抽出することです。主な目標は、グラフ データの特定のプロパティがベクトル空間でも対応できるようにしながら、グラフ データを低次元の密なベクトル表現に変換することです。グラフ表現学習は手法として分解ベースの手法、ランダムウォークベースの手法、ディープラーニングベースの手法に分けられ、ディープラーニングベースの手法の代表的なものとしてグラフニューラルネットワーク(GNN)関連のアルゴリズムが挙げられます。グラフ データの表現に豊富なセマンティック情報を含めることができる場合、ノード分類、リンク予測、コミュニティ計算、類似サブグラフ計算などの下流関連コンピューティング タスクはすべて、優れた入力特徴を取得できます。主なコンピューティング タスクには次のようなものがあります。

ノード分類 - ラベルなしで特定のノードのタイプを予測します。

リンク予測 - 既知のエンティティと別のエンティティとの関係から 1 つのエンティティを予測するか、2 つのエンティティから関係を予測します。

コミュニティ コンピューティング - 密に接続されたノード グループを特定して、ネットワーク内のコミュニティ構造を発見します。

類似サブグラフ計算 - 2 つのサブネットワークの類似性を計算するグラフ融合は、知識の類似性に基づく計算タスクとして考えることができます。

1.3.4シーン インテリジェンスに基づいた事前構築されたシーン グラフライブラリ

(1) 市内地図[ws1]

モノのインターネット、クラウド コンピューティング、ビッグ データなどのテクノロジーの発展に伴い、スマート シティの構築は知覚的インテリジェンスから認知的インテリジェンスへと徐々に改善されました。5G テクノロジーの適用により、都市の認識能力の向上が加速され、データ収集がより速く、より完全になります。データには文字、画像、音声、動画などマルチモーダルなデータが含まれており、これらのデータを有効に活用するためには、これらのデータを大きなナレッジベースに整理し、スマートシティの基礎リソースとして活用する必要があります。

ナレッジグラフは、ナレッジシステムとインスタンスデータをリソース記述フレームワーク(RDF)の形式で均一に表現し、位置合わせやマッチングなどの操作を通じて異種データを統合および融合できるため、セマンティック検索、質疑応答システムなどで使用されます。インテリジェントな顧客サービスやパーソナライズされた推奨事項などのアプリケーションにおいて重要な役割を果たしています。ナレッジグラフ技術は、ビジネスインテリジェンス、スマート医療、スマートジャスティスなど、スマートシティのさまざまな分野で幅広い応用が期待されています。

都市のスマート教育、スマートヘルスケア、スマートな人々の生活などはすべて自然人のデータを中心に開発されているため、スマートシティのナレッジグラフの構築における中心的な課題は、都市の自然人を中心としたオントロジーを構築することです。サブオントロジーは、人々の生活、教育、医療、その他の分野のデータを構築すると同時に、スマートシティナレッジグラフのアプリケーションエコロジーを実現するために、マルチドメインおよびマルチモーダルナレッジグラフ構造を形成します。

理想的なスマート シティ モデルは、現実に稼働する都市と、それに対応するネットワーク上で稼働するデジタル シティである必要があります。現実の都市の運営で生成されるさまざまなデータをリアルタイムにデジタル都市にマッピングする、つまりデジタルツインが可能です。デジタル シティは、人工知能モデル アルゴリズムを使用してタイムリーなフィードバックを提供し、現実の都市の運営を最適化します。現在、多くの都市は都市のビッグデータセンターにデータを抽出し、ローカルインテリジェンスを実現していますが、データ構造の設計は依然として実際の都市をシミュレートしています。

都市内のエンティティを通じて都市のナレッジ グラフを構築し、関係の方向、強度、タイミング、その他の情報をグラフに記述します。スマートシティ ナレッジグラフと一般的なスマートシティ ビッグデータセンターの違いは以下の 3 点です。

人間中心の設計アイデアにより、スマート シティは人々により良いサービスを提供できるようになります。一般的なビッグデータセンターは、人間中心のデータアーキテクチャを形成せず、自然人情報、法人情報、地理情報、経済運営情報などをワンレベルに配置しています。

データは特定のビジネスに関連付けられるのではなく、都市ビッグデータの属性分類と関係分析を経て、より高度な知識ベースが抽出され、実際のデータ共有に役立ちます。

グラフ データベース テクノロジとセマンティック Web 記述システム、標準、およびツールを組み合わせることで、コンピュータ システムによる大規模な知識システムの保存と取得が容易になり、特にセマンティック検索、インテリジェントな顧客サービス、質疑応答システムなどにおける人工知能モデルの有機的な組み合わせが容易になります。などのアプリケーション。

(2) 園内マップ

合理的な公園開発政策を策定し、投資効果、事業損失傾向、政策実施効果などを分析・予測し、タイムリーに政策を調整できることは、公園の運営を継続し高い地位を獲得するために非常に重要です。データ分析だけでは未来の評価や予測を実現することはできませんが、時空間人工知能技術はその機会を提供します。公園のコミュニケーション分析、公園の類似性クエリと関係の発見、ベンチマーク公園との比較分析などのインタラクティブなグラフ分析を提供します。マルチソースの時空間データ マイニングと人工知能ベースの時空間マッピング テクノロジーを使用して、公園のライフ サイクル全体の動的な管理を実現します (図 3-4)。

対象公園の基本情報照会:所在地、業種などの指標に基づいて関連情報を照会、表示には公園企業、定住人口、就業人口、旅客流動、内外交流、職住バランス指数、交通機関などが含まれる利便性や周辺施設、有力企業、産業などの情報をご紹介します。

業界相関分析: 細分化された業界ラベルの上流および下流の関係分析サービスを提供し、業界チェーンを強化、補充、増加、拡張するための基盤を提供します。

企業のポートレート: 政府データを統合して、政府が企業法人のデータベースと企業関係マップを構築するのを支援し、企業と法人を監督するさまざまな機能部門に情報サポートを提供します。

パーク投資促進:パークの産業構造、産業チェーンの全景、企業自身の開発リスクに基づき、パークの開発ニーズを満たす様々なシナリオや条件の組み合わせで企業をスクリーニングし、最も適した企業を選定します。公園の産業発展の方向性と傾向に適しています。

公園の位置付け計画: 産業計画のない公園については産業計画についての提案を行い、すでに産業計画がある公園については産業の完成に関する提案を行います。

公園の動的評価:産業都市統合、産業集積、Win-Win協力などの第4世代工業団地の発展方向に基づいて、測定可能で動的かつ更新可能な公園評価システムを確立します。革新性、健全性、競争力、影響力、開発などのさまざまな側面から公園の包括的な評価を実施し、公園運営者や政府管理者が公園の全体的な企業状況を明確に理解できるようにします。

公園の属性の比較: 公園は、開発プロセス中に核となる競争力を継続的に向上させる必要があり、ベンチマーキング管理は、優れた公園をベンチマークすることで公園の競争力を強化する効果的な管理手法です。ベンチマークパークとのギャップを特定し、その成功体験から学ぶことで、開発におけるいくつかの落とし穴を効果的に回避できます。公園のベンチマーク データを収集し、それを迅速にモデル化して自分の公園と比較し、2 つの主要な違いを見つけて実用的な解決策を策定する方法は依然として難しい問題です。ナレッジグラフに基づいて、グラフ表現学習アルゴリズムと類似サブグラフ計算を使用して、自身のパークとヘッドパークの間のグラフの類似性を計算し、最大の差異点、つまり潜在的な最適化点を自動的に強調表示します。

公園の最適化提案: 最大の差異に基づいて、対応する最適化提案に対するインテリジェントな推奨事項が作成され、最適化提案を採用した後の公園の総合スコアがリアルタイムで計算されます。

編集スイッチを中央に切り替える

図3 公園ナレッジマップ

編集スイッチを中央に切り替える

図4 パークナレッジグラフの可視化

(3) コミュニティマップ

時空間 AI アルゴリズムを使用してインターネットなどのビッグ データを取得し、データ フュージョンを使用して複数のソースや関係者からのデータを関連付けて、コミュニティの知識の融合を行います。グリッド価値評価モデルとコミュニティ 知恵マップを開発し、グリッド内のユーザー価値評価結果を通じてグリッドのプロファイリングを行います。時空間 AI テクノロジーを使用してグリッド ポートレート分析モデルを構築し、地図上の任意のグリッドまたはグリッドの組み合わせを通じて、グリッド領域内の居住人口、労働人口、企業、インフラストラクチャ、治安などのリアルタイム分析と推論を行います。直感的な視覚化結果を形成し、関係者が直接情報を入手できるようにします。包括的な人口分析、人口流動傾向、コミュニティの比較、評価単位の領域における社会保障などのラベルを含む地域の状況を迅速に分析および推定することができ、コミュニティ管理者がさまざまな地域の状況を迅速に理解するのに効果的に役立ちます。人々の生活、治安、資源配分、その他の業務の実施は、コミュニティ管理者やコミュニティサービス担当者にとって、人々により良いサービスを提供するための利便性を提供します。

(4) 混雑マップ【ws2】

群衆マップとは、特定の指標に基づいて多次元データの計算結果を出力する、群衆指向のポートレート ラベリング システムを指します。群衆の活動、移動軌跡、アクティブな場所、職場、住居、車両の状態に基づくオフライン アプリケーション シナリオと組み合わせると、ユーザー グループの識別とユーザー グループ化のためにさまざまなタグ、群衆分類、その他のコンテンツが生成され、サインイン データを使用して構築されます。ユーザー グラフと同時に、ユーザーの位置とフレームワークを組み合わせてユーザー属性を推定します。このフレームワークは、ユーザーのチェックイン データから 1 人のユーザーの空間、時間、位置の知識を抽出し、時空間人工知能エンジン手法を使用して、チェックイン場所に対するユーザーの好みを生成し、ユーザー属性を推測します。

ポートレートタグは、専門的な時空間人工知能アルゴリズムを使用して旅行データを収集および処理し、高度な自動データテクノロジーと組み合わせて、人と地理的位置の組み合わせを通じて、人と地理的位置の間の相関データを組み合わせてデータをインテリジェントにクリーンアップします。変化、頻度、その他の状態を把握して群衆タグの分割とオフラインシーンのキャプチャを実現し、クラスタリングアルゴリズム、行動認識アルゴリズム、予測アルゴリズムを包括的に使用してデータをモデル化および分析し、ユーザーの行動特性を深く学習し、データからユーザーのポートレートを描画します統計から知識の計算までを行うと、群集マップが形成されます。

(5) 店舗マップ

さまざまなオフライン小売シナリオに対して、正確なレコメンデーション テクノロジーに関する関連研究が実施されています。これには主に次の部分が含まれます。まず、製品ナレッジ グラフを構築し、ユーザー ポートレート ラベル システムを設計し、購入した製品を通じてターゲット ユーザーにグループ ラベルを付けます。グループタグに基づいて、推奨される結果が生成されます。次に、対象ユーザーと商品を購入したユーザーの買い物行動の類似性を分析し、設定した閾値を満たす類似ユーザーの集合を見つけ、その集合内の類似ユーザーが購入した商品をユーザーの嗜好として利用し、目標値を計算します。候補となる特定の製品に対するユーザーの好み、推奨結果を生成するための関心の度合い。

(6) 製品マップ

電子商取引が世界市場で拡大し続ける中、製品知識グラフは重要な役割を果たしており、プラットフォーム ガバナンス、ブランド運営、フロントエンド ショッピング ガイドなどの中核ビジネスで広く使用されています。電子商取引分野では商品の種類が多岐にわたり、属性システムが膨大であるため、商品ナレッジ グラフと一般ナレッジ グラフの間には一定の違いがあります。したがって、この記事では主に、製品属性に基づいた製品マップの構築と、異なる言語での製品マップの調整と融合について研究します。

属性別製品マップは、主に製品の属性と属性値情報を記述したものである。ルールベースのアプローチを用いて、製品の属性情報を抽出するためのドメイン関連ボキャブラリーを設計し、属性強化型属性値抽出モデルに基づいて、属性を単にタグの種類として捉えるだけでなく、その意味情報もモデル化し、製品の属性情報を抽出します。数万のレベル、プロパティ、モデルがこれまで見たことのない新しいプロパティも含まれます。製品ナレッジグラフは、詳細な製品情報やオープンな業界情報をもとにグラフを活用して製品情報を蓄積し、製品管理や製品推奨などの企業活動に活用できます。製品ナレッジ グラフには多くのアプリケーション シナリオがあるため、製品ナレッジ グラフは概念的ナレッジ グラフ、プロセス ナレッジ グラフ、専門知識グラフ、全体的なフレームワーク ナレッジ グラフなどにさらに分割されます。異なる製品グラフを構築する焦点と方法は異なります。電子商取引プラットフォームの日常業務において、商品の属性情報を記述する商品ナレッジグラフは、ショッピングガイドやレコメンデーションなどの活動において重要な役割を果たします。このタイプの製品マップには、[商品実体、属性、属性値] の 3 つの組み合わせからなる、製品の詳細な属性情報が含まれています。

1.4 時空間情報の可視化

時空間情報の視覚化とは、時空間に関連する情報をコンピュータの視覚化によって表示することであり、人間が情報化時代における時空間プロセスの内包や法則を洞察するための重要な手段であり、効率的なヒューマン・コンピュータ・インターフェースです。データ分析、データマイニング、その他の手法を効果的に補完するものでもあり、重要な場面ではかけがえのない役割を果たします。時空間情報の可視化の代表例としては、大気汚染センサーデータの可視化解析、タクシー軌跡データのビジュアルクエリ、多変数統計データ分布の定量的ビジュアル解析、都市の多次元情報のビジュアル解析、都市の三次元大気可視化などが挙げられる。気象庁の分析など デジタルツインシティの基礎は、都市の時空間情報のリアルタイム視覚化であり、都市の大小のコンポーネントや機械の稼働状態を複数の粒度で真に復元し、現実の都市を制御するインターフェースを提供します。仮想環境で。

編集スイッチを中央に切り替える

図5

これまで、データのグラフ表現は円グラフ、棒グラフ、折れ線グラフなどの単純な視覚表現にとどまっていましたが、データ情報をより効果的に伝え、ユーザーの理解を助けるために、現在のマルチメディア技術に頼って視覚的な表現を開発しました。平面から立体へ、紙からインターネット、動画、仮想環境に至るメディア形態は、インタラクティブ性やタイムリー性の観点から常に変化しており、スマートシティの構築においては、3D技術とAIやVRの高度な組み合わせが求められています。テクノロジーにより、人間は新しいインタラクティブな体験を生み出すことができました。

1.4.1 説明的な視覚化

記述的可視化とは、人がチャートを観察することで、チャートで表現される規則的な価値情報を直接受け取ることであり、操作を必要とせず、直観的な視覚のみで情報を受け取ることができるのが特徴です。今日の高速ネットワークとビッグデータの背景に依存しているため、データの適時性が特に重要です。視覚化技術とインターネット技術の統合は、Web の利便性に基づいており、地図ベースの視覚化手法と GIS、地図、その他の業界との組み合わせにより、より優れた視覚効果が得られ、データ内のグループ情報を非常に直観的に表示できます (図 6)マップと組み合わせたビジュアライゼーションには、散布と集約のビジュアライゼーション、線形ビジュアライゼーション、および階層的なカラーリングのビジュアライゼーションの 3 つの形式があります。

編集スイッチを中央に切り替える

図6 マップの組み合わせに基づく時空間データの可視化

1.4.2 マイニングの視覚化

可視化技術とデータマイニングは相互に推進しており、データマイニングとデータ可視化を組み合わせるには、現在、可視化技術を情報分野に適用し、データマイニングを通じてデータベースから有益な情報を抽出する方法と、データを先に実行する方法の3つの方法があります。次に、視覚化をデータ マイニング ツールに適用します。3 つ目は、データ マイニングを補完および改善する方法としてデータ視覚化を使用することです。ビッグ データ マイニングに一般的に使用される方法には、分類、クラスタリング、相関ルール、ニューラル ネットワーク、Web データ マイニング、ディープ ラーニングなどが含まれます。データ マイニングの視覚化により、人々が使用できるデータの潜在的な価値パターンを深く分析できます (図 7)。

編集スイッチを中央に切り替える

図 7 データマイニングのための時空間視覚化

1.4.3 インタラクティブな視覚化

インタラクション プロセスは実際には特定のタスクの集合であり、ユーザーは必要に応じてビジュアル インターフェイスのグラフィック要素を使用してインタラクティブで応答性の高いデザイン分析を実行し、データに対するユーザーの制御を強化し、次のような良好な人間とコンピューターの関係を確立します。シーン内の一部のインタラクティブ操作には、3 次元シーンや仮想現実シーンでのインタラクティブ操作も含まれており、ユーザーからインタラクティブなフィードバックを受け取り、そのフィードバックに基づいて新しい視覚的結果を生成して、クエリ、検索、その他のニーズを実現します。3D ビジュアライゼーション、仮想現実、3D インターネットなどのテクノロジーの継続的な開発と深化により、人々はコンピューターを使用してグラフィックス、画像、ビデオ、サウンド、アニメーションなどを処理し、インタラクティブな 3D アニメーション、ダイナミック シミュレーション、およびシミュレーションを作成できるようになりました。シミュレーションと強い視覚的インパクトにより、ユーザーのデータ認識能力が向上します (図 8)。近年のインタラクティブビジュアライゼーションの成果は、主に次の 2 つの側面に分けられます: 1 つは時空間データの動的ビジュアライゼーションと可視性分析、2 つは仮想現実技術を使用して地形環境をシミュレートし、インタラクションと分析を実行することです。 。たとえば、ユーザーは、人口管理、交通計画、都市建設などのタスクのために、都市 3D モデルに基づいて効率的かつインテリジェントな人間とコンピューターのインタラクション操作を実行し、現実と仮想の完璧な組み合わせを実現できます。

編集スイッチを中央に切り替える

図8 時空間情報相互作用の可視化


おすすめ

転載: blog.csdn.net/HaishenTech/article/details/124835854