ナン姉妹のテクノロジートーク: グラフ コンピューティングについて | JD Cloud テクニカル チーム

みんながいつもの仕事をしているかどうかは分からない

「グラフコンピューティング」という言葉を聞いたことがありますか?

しかし、さまざまな業務報告や技術共有などで「知能」や「人工知能」という言葉を誰もが聞いたことがあるはずだ。

 

そして今日お話しするグラフ計算について

近年の人工知能分野の注目のフロンティアの寵児です

これは、リスク管理と不正行為対策で一般的に使用される「ビッグキラー」でもあります。

 

グラフコンピューティングを理解する前に

まず、「グラフ」とは何かを理解する必要があります。

 

今日私たちが言うこと

実際、これはオブジェクト間の関係を表すために使用されるデータ構造です。

強力な抽象性と柔軟性を備えています

構造と意味の面で強力な表現力を持っています

グラフ構造の表現力が豊かだからこそ

現実には「グラフ」として表現できる例がたくさんあります。

ソーシャル ネットワーク道路網金融取引など

研究開発またはアルゴリズム関連の小規模パートナーは知っています

一般的に使用される機械学習および深層学習アルゴリズム

それらのほとんどは、定期的、整然とした、または構造化されたデータを処理するために使用されます。

マトリックス、画像、テキスト、シーケンスなど。

そして、処理されたデータは独立しており、同様に分散されていると想定されます。

ただし、グラフ上のノードは自然に接続されます。

これはノードが独立していないことを意味します

この時点で、今日説明するグラフ コンピューティングが登場します。

その核心はまさにデータをグラフ構造としてモデル化することです

そして問題の解をグラフ構造上の計算問題に変換する方法を解く

アルゴリズムタスクに複数の個人間の関連性分析が含まれる場合

グラフ コンピューティングでは、問題をグラフ構造上の一連の操作や計算として自然に表現できることがよくあります。

 

しかし、グラフコンピューティングにはさまざまな問題を解決する必要があります

1 セットのコンピューティング モデルですべての問題を解決することは困難

次にシステムサイトに行きます

グラフコンピューティングに関するあれこれ

---    ---

たとえば、エッジに方向があるかどうかによって

グラフは有向グラフ無向グラフに分けられます

エッジに重みがあるかどうか

グラフは、加重グラフと加重なしグラフに分けることもできます

グラフ内の頂点と辺に複数のタイプがあるかどうか

グラフは同型グラフ異種グラフに分類できます

また、時間の経過とともにグラフ構造やグラフ情報が変化するかどうか

グラフは静的グラフ動的グラフに分けられます

程度」と「近所

グラフ ノードに関係する 2 つの重要な概念

ノードの「次数」は、そのノードに接続されているノードの数を指します。

有向グラフの場合は、「入次数」と「出次数」も区別されます。

ノードの「隣接ノード」とは、そのノードに接続されている他のノードです

グラフの表現について

言及しなければならない基本的な概念がまだいくつかあります

1つは「隣接行列」です。

ノード間のエッジ関係を定量的に表すために使用されます。

「ノード機能」と「エッジ機能もあります

ノードとエッジを特徴付けるために使用される固有の数値プロパティ

グラフ アルゴリズム モデルがどれほど複雑であっても

これらの基本概念に基づいています

グラフに関する最も基本的な質問の 1 つであるノード表現の問題を尋ねてください。

上記グラフの情報と属性を基にどのように判断するかです

グラフ内のノードまたはエッジの定量化された表現

CV および NLP タスクで

CNNおよびRNNモジュールを設計します。

画像ピクセルとテキスト文字によって表される情報をモデル化するには

グラフ表現の学習でも同じ考え方が使われています。

合理的なノード ベクトル表現を使用する

その後、さまざまな下流タスクを調査できます

たとえば、ノードを分類するには

特別な動作やプロパティを持つノードを見つける

またはコミュニティの分割

最も強力な集約と最も高い類似性を持つノードのセットを見つけます。

さらに、リンク予測サブグラフ分割などのさまざまなダウンストリーム タスクも実行できます。

グラフコンピューティングで何をしたいですか

完全にあなたの実際のニーズに依存します

ここを参照してください

おめでとう

すでにグラフ計算を開始しています

---   ---  

グラフ コンピューティングは新しいアルゴリズムではありません

その歴史を辿ってみると

オイラーは人類史上最も偉大な数学者の一人と考えられています

ケーニヒスベルクのセブンアーチ橋の問題についての説明に対して

その後、グラフ理論という学問が登場しました。

ケーニヒスベルクの公園にて

プレゲル川の 2 つの島と川岸を結ぶ 7 つの橋があります。

オイラーは 1736 年にこの問題を研究し、証明しました。

彼は問題の原因を「ワンストローク」問題に帰した

そして一筆書きが不可能であることを証明してください

彼の研究中に

問題内の土地と橋をそれぞれ点とエッジに抽象化します。

単純なトポロジーグラフを形成します

グラフに関する基本概念を紹介します

その後、グラフ理論の初期の応用である領域レンダリング (色付け) が行われました。

15世紀から17世紀の大航海時代の到来

フランス革命後の国民国家概念の台頭

世界中の国が高解像度の地図を作成し始めています

また、図面内で最小限の色を使用して、隣接する 2 つの領域 (国、州、県) を確実に表示する方法についても説明します。

異なる色で区別する問題は古典的なグラフ理論の問題です

19世紀半ば、数学者は「5色マップ」の問題を手計算で証明した

そして丸一世紀後の1976年まで、

「4 色マップ」の実現可能性が最初に証明されたのは、コンピューターの計算能力の助けがあってのみでした。

そしてグラフ計算による最適化後

5 色のマップを 4 色のマップに置き換えました。

上記の地図の色付け問題は、数学における典型的な NP 完全問題です。

ナビゲーション、リソースのスケジュール設定、検索および推奨エンジンなど

ただし、これらのシナリオに対応するビッグデータのフレームワークとソリューションは、

初めに

ネイティブのグラフ ストレージとコンピューティング モードは実際には使用されません。

言い換えれば、人々は依然としてカラム型データベースを使用しているということです

あるいはグラフ理論の問題を解決するための文書データベースさえも

複雑で高次元の問題を強制的に解決するために、非効率的で低次元のツールが使用される

その場合、ユーザーエクスペリエンスが劣るか、入出力比が非常に悪い可能性があります。

近年ではインターネットの発達により、

徐々に人々の心に浸透していくナレッジグラフ

グラフ コンピューティングとグラフ データベースの開発は、新たな注目を集め始めたばかりです。

過去半世紀の間に、多くのグラフ コンピューティング アルゴリズムが登場しました。

1956 年に登場した有名なダイクストラ アルゴリズムを含む

研究によりグラフの最短経路問題が解決されました

時代の要求に応じて、より複雑なさまざまなコミュニティ発見アルゴリズムが登場しています

コミュニティ、顧客グループ、容疑者の間の関連性を検出するために使用されます

グラフの各頂点を低次元のベクトルとして表現することです。

そして、ベクトルがグラフの構造とコンテンツ情報をできるだけ多く保存できるようにします。

後続の学習タスクの特徴として使用できます

ノード分類、リンク予測など。

これらの作業は、同形グラフ、異種グラフ、属性グラフ、動的グラフなど、さまざまなタイプのデータを対象としています。

さまざまな案が提案されている

古典的なアルゴリズム DeepWalkLINENode2Vecを含む

これらのアルゴリズムの基本的な考え方は、ランダム ウォークに基づいてデータを生成することです。

次に、トレーニングによってパラメータを最適化します。

確率モデルを生成する

RNN、CNN などの古典的なニューラル ネットワーク モデルをグラフ データに拡張します。

各点のベクトルを学習しようとするグラフ表現学習とは異なります。

グラフ ニューラル ネットワークの目的は、実際には集計関数を学習することです。

すべてのポイントはローカル情報を使用して、同じ関数を通じて独自の表現を計算できます。

グラフの構造が変わっても、まったく新しいグラフでも

オリジナルの関数を使用して意味のある結果を計算することもできます

グラフニューラルネットワークに関しても、一連の古典的なアルゴリズムが誕生しています

---  ★★★  ---

最後に、グラフコンピューティングの実用化について話しましょう。

現在、多くの大手インターネット企業や金融テクノロジー企業が

実際、グラフコンピューティング技術とは切り離せないものです。

 

PageRank は20 世紀末に Google の創設者ラリー ペイジによって発明されました。

これは大規模なページ、リンク ランキング アルゴリズムです

初期のGoogleの中核技術は浅い同時グラフコンピューティング技術であると言える

Facebook もあります。その技術フレームワークの中核はソーシャル グラフです。

つまり、友達は友達を結び付け、友達は友達を結びつける

その結果、Facebook は強力なソーシャル ネットワークを確立しました。

Facebookは多くのものをオープンソース化している

しかし、このコア グラフ コンピューティング エンジンとアーキテクチャはオープンソースになったことはありません。

2007 年から 2008 年に勃発した世界金融危機を思い出していただければと思います。

リーマンブラザーズが倒産

ゴールドマン・サックスは撤退できた

その背後にある本当の理由は、強力なグラフ データベース システム - SecDBのアプリケーションです。

そしてテクノロジー主導のすべての新しいインターネット企業のために

Paypal、eBay、国内の金融会社や電子商取引会社の多くなど

グラフコンピューティングは珍しいことではありません

Graph のコア コンピテンシーは、データの相互関係を明らかにするのに役立ちます

過去10年間

ディープラーニングに代表される人工知能技術の普及により、

グラフ学習が徐々に話題になっている

因果関係、説明可能性においても画期的な進歩が見られる

現在、グラフ学習もさらに拡張されています

広告金融リスク管理インテリジェント交通医療スマートシティなどの分野

最後に、金融詐欺対策におけるグラフ コンピューティング アプリケーションの例についてお話しましょう。

金融や電子商取引など金銭のやり取りが伴う分野

違法な利益を目的とした闇の製品が常に存在します。

羊毛の引き抜き、注文のスワイプ、現金化、虚偽の取引など。

個々のユーザー自身が時折行う裁定取引行為と比較すると、

ギャングを単位としてさまざまなビジネスシーンで犯罪を収集し運営する黒人プロダクションギャング

彼らの行動は、プラットフォームにさらに大きく深刻な経済的損失をもたらすでしょう

グラフ コンピューティングはギャング事件を特定するための優れたレシピです

数千のユーザー、販売者、機器、ネットワーク環境などをノードとして使用することによって

利用状況やトランザクションなどの情報を付随情報としてエッジを確立する

非常に広い範囲をカバーする異種マップを形成可能

さまざまなアプリケーションの背景を組み合わせて認識対象を決定します

そして、グラフ コンピューティング モデル、サンプル、ラベルなどを選択します。

教師あり学習による 1 つのグラフ トレーニング

最後に推論段階で、グラフ内のノードまたはエッジのリスクレベルの確率出力が出力されます。

そうしたら友達がこう言うだろう

リスク管理シナリオに適した高品質のサンプルラベルが少なすぎる

大きな問題ではありませんが、教師なし学習に使用できるグラフィカル モデルも多数あります。

たとえば、コミュニティの検出にはタグ情報は必要ありません。

最も密接に関連したノード セットをクラスタ化できます

私たちの経験では

ギャングを特定するための最良のグラフ アルゴリズムの 1 つです

もう一つの例は、近年人気の自己教師あり学習と比較学習です。

グラフコンピューティングの分野に適用すると、グラフ上で教師なし事前トレーニングを実行できます。

グラフの構造とグラフの属性の性質から始める

グラフ ノードの優れた表現力を持つベクトルを学習する

さまざまな下流リスク管理インテリジェントモデルで使用可能

---  ★★★★  ---

最近AIGCの大型モデルが爆発的に増えたため、

人工知能が新たな波をもたらした

生成言語モデルと視覚モデルとの比較

グラフコンピューティングは確かにもう少し冷たいです

しかしナン姉妹は、おいしい食事は遅刻を恐れないと信じています。

輝きのない日々も全て輝きへの準備

おそらくいつか、グラフ コンピューティングも独自のホットな検索を開始するでしょう。

 

----最後に書いてます----

 この記事の構想、創造性、全体的な構造、および後の写真の修正、すべての著作権はJingdong Nanjieに属し、素材はMidjourneyとNanjieのオリジナルのプロンプトワードから生成されています。シスターナンの写真制作は容易ではなく、完璧なものではありませんので、許可なく他の機会や目的に使用しないでください。

 この記事の写真はイラストと説明のみを目的としており、誇張およびユーモラスな要素が含まれています、同じ場所をとらないでください〜類似点はまったくの偶然です〜攻撃を意図したものではありません〜

 この記事の本文は以下を参考に編集しています。

[1]. Ma Yao、Tang Jiliang. Graph Deep Learning [M]. Electronic Industry Press.

[2]. Zhang Changshui、Tang Jie、Qiu Xipeng[M]. グラフ ニューラル ネットワークの紹介[M]. People's Posts and Telecommunications Press。

[3]. Zhihu. グラフ コンピューティング開発の簡単な歴史 [EB/OL].
https://zhuanlan.zhihu.com/p/562893366

[4]. Baidu. ビッグ データの基礎 - グラフ コンピューティングの開発 [EB/OL].
https://baijiahao.baidu.com/s?id=1743913772591545506&wfr=spider&for=p

著者: 京東科技鼎南

コンテンツソース:JD Cloud開発者コミュニティ(無断転載はご遠慮ください)

{{名前}}
{{名前}}

おすすめ

転載: my.oschina.net/u/4090830/blog/8795975