hadoop et pseudo seule installation de distribution (sur la base de hadoop v2.7.2)


suggestion chaude: Vous pouvez installer tous les composants dans un répertoire fixe, tels que: Je mets ici le répertoire opt.

/opt

Télécharger les archives de la prochaine opt, décompressez

tar -zxvf /software/hadoop-2.7.2.tar.gz -C /opt/

Entrez le chemin suivant, pour faire quelques changements de configuration ./hadoop-2.7.2/etc/hadoop/

Modifier hadoop-env.sh configurer votre propre chemin jdk

Insérer ici l'image Description

Modifier le noyau site.xml, configuration IP, des ports, de lire le fichier taille du tampon

<!--配置HDFS文件系统的命名空间-->
<property>
<name>fs.defaultFS</name>
<value>hdfs://houda这里写自己的ip或者用户名:9000</value>
</property>
<!--HDFS读取文件的缓冲大小-->
<property>
<name>io.file.buffer.size</name>
<value>4096</value>
</property>

Modifier hdfs-site.xml, configurer le nombre de copies et ainsi de suite. figure

L'intérieur du nom de l'utilisateur a été changé en propre

<!--配置hdfs文件系统的副本数-->
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<!--指定hdfs文件系统的元数据存放目录-->
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///opt/hadoopdata/dfs/name</value>
</property>
<!--指定hdfs文件系统的数据块存放目录-->
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///opt/hadoopdata/dfs/data</value>
</property>
<!--配置HDFS的web管理地址-->
<property>
<name>dfs.http.address</name>
<value>houda:50070</value>
</property>
<!--配置secondaryNamenode的web管理地址-->
<property>
<name>dfs.secondary.http.address</name>
<value>houda02:50090</value>
</property>
<!--配置是否打开web管理-->
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<!--指定hdfs文件系统权限是否开启-->
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>

Copier et modifier un nom de profil

cp mapred-site.xml.template mapred-site.xml

Modifier mapred-site.xml, configure cadre sobriquet, l'histoire, les composants, etc.

<!--指定mapreduce运行的框架名-->
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
<final>true</final>
</property>
<!--配置mapreduce的历史记录组件的内部通信地址-->
<property>
<name>mapreduce.jobhistory.address</name>
<value>houda:10020</value>
</property>
<!--配置mapreduce的历史记录服务的web管理地址-->
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>houda:19888</value>
</property>
<property>
<name>mapreduce.job.ubertask.enable</name>
<value>true</value>
</property>
<property>
<name>mapreduce.job.ubertask.maxmaps</name>
<value>9</value>
</property>
<property>
<name>mapreduce.job.ubertask.maxreduces</name>
<value>1</value>
</property>

Modifier le fil-site.xml, ResourceManager liés les informations de configuration

<!-- Site specific YARN configuration properties -->
<!--指定resourcemanager所启动服务的主机名/ip-->
<property>
<name>yarn.resourcemanager.hostname</name>
<value>houda</value>
</property>
<!--指定mapreduce的shuffle处理数据方式-->
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<!--配置resourcemanager内部通讯地址-->
<property>
<name>yarn.resourcemanager.address</name>
<value>houda:8032</value>
</property>
<!--配置resourcemanager的scheduler组件的内部通信地址-->
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>houda:8030</value>
</property>
<!--配置resource-tracker组件的内部通信地址-->
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>houda:8031</value>
</property>
<!--配置resourcemanager的admin的内部通信地址-->
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>houda:8033</value>
</property>
<!--配置yarn的web管理地址-->
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>houda:8088</value>
</property>

<!--yarn的聚合日志是否开启-->
  <property>
    <name>yarn.log-aggregation-enable</name>
    <value>true</value>
  </property>
<!--聚合日志报错hdfs上的时间-->
  <property>
    <name>yarn.log-aggregation.retain-seconds</name>
    <value>86400</value>
  </property>
  <!--聚合日志的检查时间段-->
  <property>
    <name>yarn.log-aggregation.retain-check-interval-seconds</name>
    <value>3600</value>
  </property>
<!---->
  <property>
    <name>yarn.nodemanager.log.retain-seconds</name>
    <value>10800</value>
  </property>
<!--当应用程序运行结束后,日志被转移到的HDFS目录(启用日志聚集功能时有效)-->
  <property>
    <name>yarn.nodemanager.remote-app-log-dir</name>
    <value>/opt/hadoopdata/logs</value>
  </property>

esclaves Modifier

esclaves par écrit le nom d'hôte de la machine virtuelle, il y a plusieurs machines virtuelles, écrivez le nom de l'hôte de plusieurs machines virtuelles
de mon côté un test
Insérer ici l'image Description

des informations de mappage de configuration

vim /etc/hosts

Insérer ici l'image Description

S'il est plus d'une machine virtuelle peut être configuré répertoire Hadoop envoyé à d'autres machines virtuelles

scp /opt/hadoop-2.7.2/ root@192.168.8.121 /opt/

Chaque configuration de la machine variable d'environnement

vim /etc/profile

Insérer ici l'image Description

Configuration de l'atterrissage sans ssh, atterrissage sans générer des clés ssh

ssh-keygen -t rsa (无脑敲四个回车)

// Après l' achèvement de cette commande est exécutée, deux fichiers sont générés id_rsa (privé), id_rsa.pub (clé publique)
// copie la clé publique que vous voulez éviter d' atterrir sur la machine
côté doit noter: plusieurs machines virtuelles, vous nous devons envoyer quelques

ssh-copy-id ody

Mise en forme Hadoop de NameNode de service

hadoop namenode -format

Démarrer le service Voir

start-all.sh

En consultant web interface utilisateur et fil groupe est normal HDFS

Insérer ici l'image Description
Insérer ici l'image Description

Publié 15 articles originaux · louange gagné 3 · Vues 2306

Je suppose que tu aimes

Origine blog.csdn.net/weixin_38620636/article/details/104968071
conseillé
Classement