完全分散ビルドのHadoop

勧告（遭遇ピット）：

彼らは、オペレーティング・システムを使用している場合はLinuxのですが、私はのDeepinシステムでした、結果として2台の仮想マシンをインストールするHadoopマスター・ノードの起動時に、デフォルトのユーザー名は、スレーブマスターマシンであるため、ユーザー名が、起動しないにつながる、構成されていませんユーザ名。そのため、3台のマシン、ユーザ名が同じであることを確実にするために！！
ウィンドウでのデバッグのMapReduceプログラムは、winutilsをインストールする必要がほとんどないだろう。
（環境、構成を含む）完全な勧告をビルドし、テーブルのSCPのクローンを作成またはコピーします。
あなたはすべて一緒でも飼育係やカフカをしたい場合は、それも直接設定することができます。その後、SCPパス、かなりの面積を使用し、それをインストールしないでください。
クローニングは、ホスト名の変更が終了しました！
少しラフ全体のプロセスは、出会いのいくつかの詳細は、レコードを忘れてしまいました。ようこそアドバイス、問題がある場合、通知してください、私は速やかに訂正します。

仮想マシンのインストール

VMwareはCentOSの-7の仮想マシンよりにインストールされている（オペレーティング・システムは、私自身の使用するのDeepinされているのでここでは、2つのスレーブをインストール）
仮想マシンにファイルを転送します。私はすぐにscpコマンドのパスを使用しています。ユーザーは、Windowsの下で、xshell SFTPをお勧めします。
デフォルトNAT、CentOSの最小インストールに仮想マシンのネットワーク構成

構成：

ファイアウォールをオフにします

ステータスfirewalld systemctl $             ＃ビューファイアウォール状態 
の$ systemctl停止firewalldの               ＃は、一時的にファイアウォールを停止 
$のsystemctl無効firewalldの            ＃は、ファイアウォールの起動を禁止します

閉じるSELinuxの

セキュリティ強化のLinux（セキュリティ強化Linuxは）SELinuxの言及、それはLinuxカーネルモジュールで、Linuxはセキュリティサブシステムです。
```
Vimの$の/ etc / SELinuxは/ コンフィグ
 ＃がSELINUX =執行するには、SELinuxが無効=変更されます
```

NTP時刻同期サービスをインストールします。

yumをインストール- Y-NTP
 位カイからのブートを設定し 
ntpd.serviceを有効systemctl    ＃は起動
ntpdの有効systemctl 
systemctlステータスのntpd    ＃を有効にするかどうかをチェックします

：原因にあります開始されない場合がありchronyd 紛争：

chronyd systemctlを無効にする：NTPを開始、オフのことができます。

ホスト名を変更し、静的IPを設定します

（ホスト名を変更するためにいくつかの変更を行う必要があり、クローニング、後は、何をすることができますを変更するには、ip）

ステップ1：修正/ etc / sysconfig / network-scriptsに/のifcfg-xxxのファイル

メインは、次のパラメータを変更します。
```
BOOTPROTO = " 静的" 
ONBOOT = " はい" 
IPADDR = " 172.16.125.128 " 
NETMASK = " 255.255.255.0 " 
GATEWAY = " 172.16.125.2 "
```
第二部：/ etc / sysconfig / networkファイルの内容を変更します。

同上
```
＃アナコンダによって作成 
= 172.16.125.2 GATEWAY 
DNS = 172.16.125.2
```
第三ステップ：ネットワークを再起動します
```
サービスネットワークの再起動
```
SSHの構成

マスターシークレットは、無料のスレーブノードにログオンすることができます
```
$ sshを-keygenは-t rsaの
```
3つの以下のファイルを開きますの〜/ .ssh
```
-rw-rを- 。r--の1つのルートルート392 9越21時05 authorized_keysに26個の    ＃認定キー 
。-rw ------- 1ルートルート1679 20時57 id_rsaと9越26             ＃プライベート 
-rw-R - r--の1ルートルート393 26 9越20時57 id_rsa.pub         ＃公衆
```
```
上のマスターで公衆3台のマシンのauthorized_keys年に。コマンド：
```
```
$ sudoの猫id_rsa.pub >> authorized_keysに
```
他のLinux〜/ .sshディレクトリに配置されたマスターのauthorized_keys
```
$ sudoのSCPのauthorized_keys [email protected]：の〜/ .ssh
```
　　authorized_keysには、権限、コマンドを変更します。
```
$ chmodの644のauthorized_keysに
```
```
テストが成功したかどうか
```
ssh host2が直接システムに、もう一度パスワードなしでユーザー名とパスワードを入力し、[終了し、SSH host2という。これは成功を意味します。

ログインはsshの時がある場合：

ホストの信頼「hadoop2（192.168.238.130）が」できる」tを確立すること

/ etc / ssh / ssh_configの設定ファイルを変更配置され、以下の2行を追加する必要があります。
```
StrictHostKeyChecking何
UserKnownHostsFileを/ dev / nullありません
```

最後に：インストール設定JDK、Hadoopの

コアstie.xml

< 設定> 
    < プロパティ> 
        < 名前> fs.defaultFS </ 名前> <！ - デフォルトのファイルシステムの場所- > 
        < 値> HDFS：//マスター：9000 / </ 値> 
    </ プロパティ> 
    < プロパティ> 
        < 名前> hadoop.tmp.dir </ 名前を> <！ - Hadoopの作業ディレクトリ、名前ノード、データノードデータ- > 
        < 値> /ホーム/ WHR /ベンチ/ Hadoopの/データ/ </ 値>
    </プロパティ> 
</ 設定>

hdfs.site.xml

< 設定> 
    < プロパティ> 
        < 名前> dfs.replication </ 名前> <！ - コピー数- > 
        < 値> 2 </ 値> 
    </ プロパティ> 
    < プロパティ> <！ - 二子ノードの位置1つの設定- > 
        < 名前> dfs.namenode.secondary.httpアドレス</ 名前> 
        < 値>スレーブ1：50090 </ 値> 
    </ プロパティ>
</ 設定>

mapreduce.site.xml

< 設定> 
    < プロパティ> <！ - 糸と指定MapReduceの実行中のクラスタを達成するためには、分散- > 
        < 名前> mapreduce.framework.name </ 名前> 
        < 値>糸</ 値> 
    </ プロパティ> 
< / 設定>

yarn.site.xml

< 設定> 
    < プロパティ> 
        < 名前> yarn.resourcemanager.hostname </ 名前> 
        < 値> hadoop1 </ 値> 
    </ プロパティ> 
    < プロパティ> 
        < 名前> yarn.nodemanager.aux-サービス</ 名前> 
        < 値> mapreduce_shuffle </ 値> 
    </ プロパティ> 
</ 設定>

スレーブの設定ファイル

スレーブ1 
スレーブ2

マスターズ・コンフィギュレーション・ファイル（CDHのバージョンがあれば、私が使用して、このファイルを持っていません）

主人

クローン

VMwareは何も言うことをクローニングしません
クローニングは、/ etc / hostnameファイル内のホスト名を変更し、完了です！
/ etc / hostsファイル：3台のマシンにIPアドレスマッピングを追加します。

クラスタを起動

（私がクローンをフォーマットした後）ノードをフォーマット

Hadoopの名前ノード$ - 書式
  ＃が遂に登場、その成功は、最終ステータスコードを見ることができます0で 
 保存ディレクトリを/ tmp / Hadoopのルート/ DFS /名前が正常にフォーマットされています。

開始：ディレクトリへsbinに（ディレクトリが最初sbinに環境変数に設定することができます。ディレクトリにスイッチする必要はありません）

[スタート] - dfs.shが
開始 -yarn.sh

jpsコマンド

すべての起動が完了すると、スレーブマスターにログインする結果:( SSHを見ます）

あなたは、名前ノードのマスター、2つのデータノード、SecondaryNameNodeが起動している見ることができます

ResourceManagerの下糸、ノードマネージャで2つのスレーブも、完了するまでに開始します

　　4.これは、ブラウザのポート50070を介してアクセスすることができます

あなたは、MapReduceのサンプルプログラムについて実行することができます。

$ HadoopのジャーのHadoopのMapReduce--例-2.6.0-cdh5.15.2.jarパイ5

Hadoopの設定ファイル

参照プロフィール

https://www.cnblogs.com/xhy-shine/p/10530729.html

Haddop完全分散型クラスタ構造