Yingtu | リスク伝達シナリオにおける K 近傍アルゴリズムの実際的な重要性

産業分野におけるグラフ思考とグラフ データ フレームワークの効果的な開発と徹底した適用により、信頼性が高く効率的なグラフ アルゴリズムがグラフ データの探索、マイニング、アプリケーションの基礎となっています。このグラフ アルゴリズム シリーズ (詳細については推奨書籍を参照) は、アルゴリズムの実用化における Ultipa チームの経験と考え方を結集しており、業界の愛好家間の交流を促進すると同時に、企業が技術的な側面を開くことができることを期待しています。グラフデータベースのアイデアを選択します。

Kホップ ネイバー (K ホップ ネイバー) は、幅優先 (BFS) [1] トラバーサル法に基づいて開始ノードの周囲を探索するアルゴリズムであり、関係の発見と影響予測に広く使用されています。推奨事項やその他の予測シナリオ。

写真
図 1: グラフ データベースの幅優先トラバーサルに基づく K 近傍クエリ

グラフ理論では、エッジに沿って単位パスを移動することをホップと呼びます。グラフ内の頂点を移動するとき、複数のホップが関係します。

グラフ理論は、1836 年に数学者オイラーによって提案されたケーニヒスベルクの 7 つの橋問題から初めて生まれました。これはグラフ コンピューティングの数学的基礎であり、1980 年代以降、グラフ コンピューティングは急速に発展しました。

現実の世界では、危機の伝達は典型的な K 近傍検索プロセスであり、危機が発生するエンティティを開始点[2]  、その方向に沿ってまたは逆に (エッジの特定の定義に応じて) 進行します。of [3]theedge

有名な不動産会社 HD のサプライ チェーン マップを例として、株式保有の方向や資本の流れなどを通じて危機の方向と対象をどのように明確かつ直感的に反映できるかを見てみましょう。 

写真
図 2: HD システムの「クロスリスク」伝導のパノラマ図

HD を例に挙げると、危機後のリスクの伝播経路は次のとおりです。

・第1段階:HDの関連会社に波及 ・
第2段階:従業員やサプライヤーに波及 ・第
3段階:住宅購入者に波及:サプライヤーの供給停止、従業員の作業再開拒否、HDの建設工事進行中 最悪の結末になる可能性あり)

… 類推すると、リスクは当初の HD グループから関連会社、従業員、サプライヤー、住宅購入者などに広がり、「ネットワーク」を形成し、リスクが一層ずつ広がり、「連鎖効果」が明らかです。[リスク管理分野におけるグラフ テクノロジーの詳細については、分野横断的な金融リスク管理におけるグラフ コンピューティングの革新を参照してください]

実際、伝導に関連する実際のアプリケーションの多くは、グラフ計算に基づいておらず、純粋な手動計算を使用して完了されます。

たとえば、多くの銀行の KYC (顧客確認) 部門は、法人顧客の UBO (最終受益者、最終受益者) を計算するために今でも Excel テーブルを使用していますが、そのような計算の効率と精度がいかに低いかは想像できるでしょう。

明らかに、これは多くの金融機関の時代遅れのITシステムや時代遅れの業務手法に直接関係しており、顧客に対する企業影響分析など、金融機関の事業展開に支障をきたすことになる。企業影響力分析の内容は、株式の保有関係や生産の需給関係などの従来の問題をはるかに超えたものであり、企業に関連するすべての財務上の行動や出来事、さらにはこれらの出来事や行動に直接的または間接的に関連する事項も含まれることを私たちは知っています。 、研究範囲に含める必要があります。同時に、分析の出発点は一企業に限定されるのではなく、その企業が発行する商品や債券にまで拡張されるべきである…。

図 3 に示すように、分析の中心となるのは特定の企業の社債であり、この社債の価格下落は、その企業が発行する他の社債の価格に直接影響を与える可能性があります。

写真
 図 3: 社債価格の下落は、その企業の他の社債価格に影響を与える

図 4 は、債券を保有し、影響を受ける可能性がある州内の他の企業を示しています。

写真
 図 4: 社債価格の下落は社債を保有する他の企業に影響を与える

図 3 と 4 は、債券の 1 段階隣接を示しています。これらの隣接を探索し続けることで、図 5 に示すように、債券価格が下落した後に危機伝達効果を得ることができます。

写真
図 5: 特定の債券の価格下落は債券市場全体に影響を与える

専門家は、金融リスクは単独で存在するものではないことをますます認識しており、さまざまなリスクは連鎖的に影響を及ぼします。蝶が羽ばたくと、市場を超えてリスクが伝染する可能性があります。リスクの相関関係には相互変換があり、移転と結合の特徴があります。グラフ テクノロジーとバタフライ効果は本質的に同じです。つまり、さまざまなソースからのデータを深くマイニングすることで、ネットワーク分析を通じて洞察を得ることができます。[続きを読む、リンク:グラフ コンピューティングが銀行の流動性リスク管理の変化を引き起こす ]

さらに、財務シナリオはロングチェーン計算に基づいており、さまざまなバックトラッキングや帰属が含まれるため、技術実装のルールがより複雑になり、データ計算の量が多くなり、適時性もより重視されます。真にリアルタイムで包括的で詳細な浸透、取引ごとの追跡可能性、正確な測定監視と早期警告を達成することによってのみ、金融リスク管理を「バタフライ効果」リスクの発生から保護することができます。[続きを読む、リンク: Boiling Point・独占インタビュー | 銀行の流動性リスク管理を強化するテクノロジーの「AI パス」Boiling Point & London Liquidity Management Conference Ultipa が発表 ]

グラフには、有向エッジまたは無向エッジ、エッジの属性の重み、K 近傍に K-1 近傍が含まれるかどうか、計算ループの処理方法など、複雑な属性と定義が含まれる場合が多いことに注意してください。これらの問題は相違点につながります。 K 近傍アルゴリズムの特定の実装において。さらに、実際のシナリオによっては、グラフ自体のトポロジー構造の変更、フィルター条件の設定、ノードおよびエッジの属性の変更が K 近傍計算の結果に影響します。[続きを読む、リンク:グラフ データベース クエリとアルゴリズムの正確性の検証 ]

さらに、業界における K 近傍アルゴリズムのアプリケーションは、ほとんどがマルチモーダル異種グラフであり、これは単一の情報を持つ多数のグラフを融合した包括的なグラフです。これにより、アルゴリズムの実装に携わる人々のデータ収集と構成能力に非常に高い要件が課されるだけでなく、K ネイバー アルゴリズムが柔軟性や機能性などの点でビジネス ニーズを満たすことができるかどうかについても、より高い要件が課せられます。[ Ultipa の高密度同時グラフ アルゴリズムは、現在、世界最速かつ最も豊富な (100 以上) グラフ アルゴリズム ライブラリのコレクションであり、EXTA インターフェイスを介してホットスワップおよび拡張できます。

多くの公開資料で、K 近傍アプリケーションの多くの例が同形グラフ (1 種類の点と 1 種類のエッジのみ) であることがわかると、そのほとんどは次のとおりです。

· 著者は、ソーシャルネットワーク上の友達推薦の応用シナリオなど、簡単な例を通して自分の主張を説明したいと考えています。

・ 構成能力が不十分なため、アルゴリズムの使用が制限される

·  K 近傍アルゴリズムの実装が不十分で、異種グラフを適切に処理できません。

K 近傍の適用は広範で実用的であり、現実の問題を解決できる必要があります。後者の 2 つの状況がアルゴリズムの「全体像」を制限する場合、関連するグラフのメーカーは 1 つまたは 2 つのことを反省し、改善する必要があります。彼ら自身!

アルゴリズム設計の品質には、問題を解決する能力に加えて、計算の効率、つまりコンピューティング能力にも注意を払う必要があることに注意してください。最後に、企業が市場のさまざまなグラフ コンピューティング製品を選択する際の参考として、高性能グラフ コンピューティング (グラフ データベース) システムが持つべきコア機能をいくつかリストします。

高速グラフ検索機能:高QPS/TPS、低遅延、リアルタイム動的プルーニング(フィルタリング)機能

·あらゆるサイズのグラフ (10 層以上) の深度、リアルタイム検索、およびトラバース機能

·高密度、高同時実行グラフ コンピューティング エンジン: 非常に高いスループット レート

·成熟した安定したグラフ データベース、グラフ コンピューティングおよびストレージ エンジン、グラフ イン プラットフォームなど。

·スケーラブルなコンピューティング機能: 垂直方向および線形のスケーラビリティをサポートします。

3D+2D高次元可視化、高性能ナレッジグラフWebフロントエンドシステム

便利で低コストの二次開発機能(グラフクエリ言語、API/SDK、ツールボックスなど)

[詳細情報、リンク: Expert Observation | 同時実行性の高いグラフ データベース システムを実装するにはどうすればよいですか? & グラフ ビュー | 映画「マン ジャン ホン」のグラフ データベースの高次元性をご覧ください。 &  Boiling Point | 「コアの欠如と小さな魂」に別れを告げる: 自社開発の革新的なコンピューティング パワーの「コア」を使用して、財務の強力な基盤を強化する ]

[1] 幅優先検索 (BFS) はルート ノードから開始し、ツリーの幅に沿ってツリーのノードを横断します。すべてのノードにアクセスすると、アルゴリズムは中止されます。
[2] 点(ノード)とは、実世界の実体、すなわちグラフ理論における頂点(バーテックス)を表し、Ultipaグラフシステムではノードとも呼ばれます。
[3] エッジは、現実世界のエンティティ間の関係、つまり 2 つのノードを接続するエッジを表します。Ultipa グラフ システムのエッジはすべて有向エッジです。エッジの 2 つの端点は同じでも異なっていてもよく、同じ場合、そのエッジは自己ループ エッジ (Loop) と呼ばれます。
[4] 「グラフ データベースの原則、アーキテクチャ、およびアプリケーション」; Sun Yuxi、Yingtu チーム; 2022-8; Machinery Industry Press。

写真

· Yingtu | グラフ データベース クエリとアルゴリズムの正確性の検証

· Yingtu | パラサイトネットワークにおける中心性アルゴリズムの研究 

· Yingtu  | Louvain コミュニティ識別アルゴリズムの基本概念 (Louvain) - 重み度

· Yingtu  | Louvain コミュニティ識別アルゴリズムの基本概念 (Louvain) - コミュニティ圧縮

おすすめ

転載: blog.csdn.net/Ultipa/article/details/131876980