Spark Review 11：組み込みのグラフアルゴリズム、PageRankアルゴリズム分析、シンプルなケース - コードワールド

Spark Review 11：組み込みのグラフアルゴリズム、PageRankアルゴリズム分析、シンプルなケース

その他 2020-04-20 17:54:56 訪問数: null

1. PageRankアルゴリズムの説明：

1.1各頂点を1 / Nのページランキング値で初期化します。Nはグラフ内の頂点の総数です。

1.2ループ：
各頂点は、出力エッジに沿って1 / MのPR値を送信します。ここで、Mは現在の頂点の出力次数です。

各頂点が隣接する頂点から他の送信されたPR値を受信すると、これらのPR値の合計が現在の頂点の新しいPR値として使用されます。

グラフの頂点のPRは、前の反復と比較して大幅に変化せず、反復は終了します。

2. PageRankアルゴリズムの場合：

package sparkGraphX

import org.apache.spark.graphx.{Graph, GraphLoader, VertexRDD}
import org.apache.spark.{SparkConf, SparkContext}

object pageRankTest {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf().setAppName("SimpleGraphX").setMaster("local")
    val sc = new SparkContext(conf)
    sc.setLogLevel("WARN")
    val graph: Graph[Int, Int] = GraphLoader.edgeListFile(sc,"D:/web.txt")
//  val web: VertexRDD[Double] = graph.pageRank(0.001).vertices   //动态调用 参数为收敛值
    val staticPage: VertexRDD[Double] = graph.staticPageRank(5).vertices  //静态调用 参数为迭代次数，第二个参数为resetProb: Double = 0.15为方法写死的值，不需要写即可。
    staticPage.collect.foreach(println(_)) //输出计算的结果

  }
}

印刷結果：頂点のグラフィック表現：

結果の分析：

2は度数が最も多いため、ランキング値が最も高く、頂点2の度数は1つだけであり、8であるため、値8は比較的高くなります。度数8は1で、度数1は度数が2つあり、ランキング値を広げます。等々。ランキング値係数の影響もあります。これは予備的なアプリケーションです。

ITが世界を創造する

元の記事を29件公開・ 55 件を賞賛・ 1491件を訪問

プライベートの手紙の懸念

おすすめ

転載: blog.csdn.net/csdnliu123/article/details/105636761

Spark Review 11：組み込みのグラフアルゴリズム、PageRankアルゴリズム分析、シンプルなケース

SparkでのPageRankアルゴリズムの簡単な実装

Spark Review 9：Spark GraphXの概要とSparkグラフ集約操作の関連ケース

ALSと説明Spark2.0協調フィルタリングアルゴリズム

ビッグデータコース K10 - Spark の Vector_Space_Model アルゴリズム

アルゴリズムモデル組み込みMendixアプリケーションの開発例

Sparkカーネル分析（5）Sparkタスクスケジューリングの原理とメカニズムの詳細な分析

ビッグデータコース K18 - Spark の ALS アルゴリズムと明示的な行列因数分解

機械学習-KNNアルゴリズムの原理&& Sparkの実装

機械学習-KMeansアルゴリズムの原理&& Sparkの実装

Spark が KMeans アルゴリズムを実装するコード例

アルゴリズムの設計と解析Review-- 2ウェイマージソート

組み込みアルゴリズム移植最適化研究ノート6-CUDAプログラミング

組み込みアルゴリズム - フーリエ変換アルゴリズム

Maven を使用して、サイズが大きくアップロードに時間がかかる Spark プログラム jar パッケージをコンパイルするための完璧なソリューションです。

Spark review 10：グラフ集約操作（aggregateMessages）、PregelおよびPregel API、および操作ケース分析

組み込みチームのトレーニング_データ構造とアルゴリズムの概要

Spark Review 8：Spark操作プロセスとSparkパーティションとSparkContextを簡単に説明します

一般的に使用される組み込みアルゴリズム - 一次 RC ローパスフィルターアルゴリズム

《Spark》-----Sparkの基本

組み込みシステムにおける蓄積および検証アルゴリズムの適用〜

PageRankのアルゴリズム（ページランク）

ランダムアルゴリズムと組み合わせるサービスへのアクセス

組み込みアルゴリズム移植最適化研究ノート2-SIMDプログラミング（単一の命令ストリームと複数のデータストリーム）

組み込み機器の支持状態秘密アルゴリズム方法

シャッフリングアルゴリズムアルゴリズム（ランダムスクランブリングアルゴリズム）

怠惰ながん書き込みアルゴリズム（スライディングウィンドウ）

一般的に使用される埋め込みアルゴリズム - シンプルなフィルタリング

データ構造とアルゴリズム（4） - 組み込みデータ型のPythonのパフォーマンス

アルゴリズムケース分析-文字列パターンマッチングアルゴリズム

おすすめ

GitHub のホットリストに急上昇 — オープンソースのプログラミング言語とフレームワークは、どうしてこんなにも魅力的なのでしょうか?

北京ヒューマノイドロボットイノベーションセンターが、擬人化走行用の純粋な電気駆動を備えた世界初のフルサイズヒューマノイドロボット「Tiangong」を発売

ランキング

アリクラウドサーバ_ubuntu ECSシステムディスク拡張システム_

ボタンをクリックしてクリップボードにコピーします

脅威ハンティングを使用してサイバーセキュリティを強化する

ライン画像やコンテナnginxのの建設

Python での try の使用について書く

リアルタイムのデータウェアハウスを構築する方法高速データ時代、MySQLのAnalyticDBはあなたを教えて

Docker でのネットワークおよびデータ管理 (Docker Swarm クラスターおよび Docker データ管理を含む)

Java ループの比較: 従来の for ループ、拡張された for ループ、および forEach ループ

浙江大学版「C言語プログラミング（第3版）」演習2-18

Gestion du temps RTOS - Utilisation de la fonction de crochet SysTick pour réaliser l'échantillonnage de synchronisation et les sous-sections de ce chapitre

アーカイブ

もっと

2024-04-27(29)

2024-04-26(22)

2024-04-25(31)

2024-04-24(30)

2024-04-23(31)

2024-04-22(5)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)