ビッグデータ-SparkのインストールとデプロイおよびPython環境の構成 - コードワールド

ビッグデータ-SparkのインストールとデプロイおよびPython環境の構成

その他 2021-03-29 18:38:33 訪問数: null

複数のサーバー、実験環境を構成する必要があります：マスターとデータの2つのサーバー、hadoopがインストールされています、前の記事を参照してください！！！

1.sparkのインストール

マスターインストール

（1）scalaとsparkをダウンロードする

（2）環境変数を解凍して構成します

export SCALA_HOME=/usr/local/scala
export PATH=$PATH:$SCALA_HOME/bin


export SPARK_HOME=/home/spark-2.4.5-bin-hadoop2.6
export PATH=$PATH:$SPARK_HOME/bin

（3）spark-env.shファイルを構成します

export SPARK_MASTER_IP=IP
export SPARK_MASTER_HOST=IP
export SPARK_WORKER_MEMORY=512m
export SPARK_WORKER_CORES=1
export SPARK_WORKER_INSTANCES=4
export SPARK_MASTER_PORT=7077

（4）スレーブファイルを設定します

data

データのインストール

（1）scalaとsparkをダウンロードする

（2）環境変数を解凍して構成します

export SCALA_HOME=/usr/local/scala
export PATH=$PATH:$SCALA_HOME/bin


export SPARK_HOME=/home/spark-2.4.5-bin-hadoop2.6
export PATH=$PATH:$SPARK_HOME/bin

（3）spark-env.shファイルを構成します

export SPARK_MASTER_IP=IP
export SPARK_MASTER_HOST=IP
export SPARK_WORKER_MEMORY=512m
export SPARK_WORKER_CORES=1
export SPARK_WORKER_INSTANCES=4
export SPARK_MASTER_PORT=7077

起動してテストします。

開始するsbinディレクトリを入力します：start-all.shまたはstart-master.sh、start-slaves.sh、jpsを入力します：

マスター表示：データ表示：

次に、pysparkを開始します。

pyspark

正常にアクセスして、モードを変更できます。

pyspark --master spark://master_ip:7077

2. Anacondaを構成し、Jupyterにリモートアクセスします

（1）Anacondaをインストールします

インストール：

環境変数を構成します。

（2）Jupyterのリモート構成

参照：https：//blog.csdn.net/MuziZZ/article/details/101703604

（3）pysparkとpythonの組み合わせ

export PATH=$PATH:/root/anaconda3/bin
export ANACONDA_PATH=/root/anaconda3
export PYSPARK_DRIVER_PYTHON=$ANACONDA_PATH/bin/jupyter-notebook
#PARK_DRIVER_PYTHON="jupyter" PYSPARK_DRIVER_PYTHON_OPTS="notebook" pyspark
export PYSPARK_PYTHON=$ANACONDA_PATH/bin/python

アクセスインターフェース：

おすすめ

転載: blog.csdn.net/qq_28409193/article/details/113346624

ビッグデータ-SparkのインストールとデプロイおよびPython環境の構成

Python および PyCharm ツールの環境インストールと構成

Python + Selenium環境のインストールと構成および例

軽量ログ収集ツールFileBeatのインストール、構成、および使用のビッグデータElasticsearch

ビッグデータ・デプロイメント環境のインストール--MySQL

[Pythonの基本] 02. PyCharmのPython環境のセットアップとインストールおよび構成

Zeeplinは、ローカルモードのSparkインタープリターエラーを構成、使用、およびデバッグします

ビルドに擬似分散環境--Hadoopビッグデータデプロイメント環境の章

2021年最新バージョンのMongoDBデータベースのインストールおよび構成環境（windows10システム）

ニュースリアルタイム解析システムSpark2.X環境の準備、コンパイルおよびデプロイの実行

ビッグデータベース環境--jdk1.8デプロイメント環境のインストール

Pythonのダウンロードとインストールおよび環境構築

Linux環境でのVSコードのPythonおよびC++デバッグ環境のインストール

Pythonインタプリタのインストールとデバッグ環境変数

CentOSインストールTomcat環境のインストールおよび構成プロセスの完全バージョン

ビッグデータプラットフォーム-Zookeeperのインストールと構成

ビッグデータプラットフォーム-HBaseのインストールと構成

Javaの、JDKのダウンロード、環境をインストールおよび構成

CentOSのは、本番環境をインストールおよび構成nodejs

Mavenのインストール、構成環境変数、および使用

スパークソースのコンパイラおよびローカル構築するためのデバッグ環境

ディープラーニングを開始するためのステップバイステップガイド (1): ナニーレベルの Anaconda および PyTorch 環境構成ガイド

JDKのダウンロード、インストール、および構成環境

HCIP-IERS はエンタープライズレベルのルーティングおよびスイッチングネットワークを展開します_BGP プロトコルの機能と構成_IBGP および EBGP

Python3仮想環境（VirtualEnv）およびvirtualenvwrapper拡張パッケージのMacインストールおよび構成

Node.js のダウンロードとインストール、および環境変数の構成 (詳細なチュートリアル)

HCIP-IERS はエンタープライズレベルのルーティングおよびスイッチングネットワークを展開します_IS-IS プロトコルの機能と構成_IS-IS 構成の実験

データベース基盤 - 2. MySQL のアンインストールとインストール、および関連する環境設定

Padlex に基づく C# 環境の構成とデプロイメント [インストールパッケージ付き]

練習OS-1：構成環境 - インストールおよび構成のCentOSのSSH

おすすめ

大規模な言語モデルに基づくオープンソースのナレッジベースの質問と回答システムである MaxKB GitHub Star の数が 5,000 を超えました。

ランキング

短线选股的一种方法

Javaクライアントでのユーバーのリズムワークフローで睡眠時間をキャンセルし、再スケジュール

CALIPSOデータバッチダウンロード方式

LeetCode アルゴリズム再帰クラス - ソードはオファー 26 を参照します。ツリーの部分構造

HTMLのインポート外部CSS、JavaScriptの論文

PostgreSQL 13.1、12.5、11.10、10.15、9.6.20、および9.5.24がリリースされました

アップルは、エラーメッセージがポテトに接続されていた実行する方法ポテトポテトショーをダウンロードすることができません

あなたは空腹で突然電話を切っていますか？これはテクノロジーの裏側ですか、それともテスト用の銃ですか？

VIMエディタのヒント

動的計画法の最長共通部分列（LCS）

アーカイブ

もっと

2024-05-13(8)

2024-05-12(27)

2024-05-11(31)

2024-05-10(33)

2024-05-09(30)

2024-05-08(18)

2024-05-07(34)

2024-05-06(6)

2024-05-05(0)

2024-05-04(18)