Hadoop集群安装笔记 - 代码天地

Hadoop集群安装笔记

编程语言 2018-05-13 09:40:43 阅读次数: 0

1.       虚拟机链接方式：桥接
2.       修改linux主机名
/etc/sysconfig/network
/etc/hosts
3.       修改linux ip
ifconfig eth0 192.168.1.110 netmask 255.255.255.0
4.       三台机器上建立相同用户lxw
5.       Ssh免密码登陆：
用lxw用户登陆linux1上：
ssh-keygen –t rsa
一路回车下去即可在目录/home/lxw/.ssh/下建立两个文件 id_rsa.pub和id_rsa
接下来，需要进入/home/lxw/.ssh目录，执行如下命令:
scp -r id_rsa.pub lxw@linux2:/home/lxw/.ssh/authorized_keys_linux1
scp -r id_rsa.pub lxw@linux3:/home/lxw/.ssh/authorized_keys_linux1
用lxw用户登陆linux2:
ssh-keygen –t rsa
一路回车下去即可在目录/home/lxw/.ssh/下建立两个文件 id_rsa.pub和id_rsa
再把is_rsa.pub文件复制到linux1机器上去。
scp -r id_rsa.pub lxw@linux1:/home/lxw/.ssh/authorized_keys_linux2
用lxw用户登陆linux3:
ssh-keygen –t rsa
一路回车下去即可在目录/home/lxw/.ssh/下建立两个文件 id_rsa.pub和id_rsa
再把is_rsa.pub文件复制到linux1机器上去。
scp -r id_rsa.pub lxw@linux1:/home/lxw/.ssh/authorized_keys_linux3
上述方式分别为linux1\linux2\linux3机器生成了rsa密钥，并且把linux1的id_rsa.pub复制到linux2\linux3上去了，而把linux2和linux3上的id_rsa.pub复制到linux1上去了。
接下来还要完成如下步骤:
linux1:
以lxw用户登录linux1，并且进入目录/home/lxw/.ssh下，执行如下命令：
cat id_rsa.pub >> authorized_keys
cat authorized_keys_linux2 >> authorized_keys
cat authorized_keys_linux3 >> authorized_keys
chmod 600 authorized_keys
linux2/linux3:
以lxw用户登录linux2/linux3，并且进入目录/home/lxw/.ssh下，执行如下命令：
cat id_rsa.pub >> authorized_keys
cat authorized_keys_linux1 >> authorized_keys
chmod 600 authorized_keys
通过上述配置，现在以用户lxw登录linux1即可以无密钥认证方式访问linux2和linux3了，同样也可以在linux2和linux3上以ssh linux1方式连接到linux1上进行访问了.
注意：.ssh 目录权限为700 authorized_keys文件权限为600
6.       安装jdk1.6 (root用户,三台机器执行同样操作)
先检验是否已安装了jdk:
rpm -qa | grep jdk
rpm -qa | grep gcj
libgcj-4.1.2-46.el5
java-1.4.2-gcj-compat-1.4.2.0-40jpp.115
卸载：yum -y remove java-1.4.2-gcj-compat-1.4.2.0-40jpp.115
mkdir –p /usr/java
chmod u+x jdk-6u31-linux-i586.bin
./ jdk-6u31-linux-i586.bin
配置环境变量：
vi /etc/profile
##set java environment
export JAVA_HOME=/usr/java/jdk1.6.0_31
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
source /etc/profile
java –version
java version "1.6.0_31"
Java(TM) SE Runtime Environment (build 1.6.0_31-b04)
Java HotSpot(TM) Client VM (build 20.6-b01, mixed mode, sharing)
用lxw用户配置环境变量：
vi .bashrc
##set java environment
export JAVA_HOME=/usr/java/jdk1.6.0_31
export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
source .bashrc
7.       上传hadoop-0.21.0.tar.gz到linux1:/home/lxw/
tar –xzvf hadoop-0.21.0.tar.gz
编辑/home/lxw/hadoop-0.21.0/conf/core-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href=../../"configuration.xsl"?>


<configuration>
     <property>
          <name>hadoop.tmp.dir</name>
          <value>/home/lxw/hadoop-0.21.0/hadooptmp</value>
     </property>
     <property>
          <name>fs.default.name</name>
          <value>hdfs://linux1:9000</value>
     </property>
</configuration>
编辑hdfs-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href=../../"configuration.xsl"?>

<configuration>
     <property>
          <name>dfs.name.dir</name>
          <value>/home/lxw/hadoop-0.21.0/hadoopname</value>
     </property>
     <property>
          <name>dfs.data.dir</name>
          <value>/home/lxw/hadoop-0.21.0/hadoopdata</value>
     </property>
     <property>
          <name>dfs.replication</name>
          <value>2</value>
     </property>
</configuration>
编辑mapred-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href=../../"configuration.xsl"?>


<configuration>
     <property>
          <name>mapred.jobtracker.address</name>
          <value>linux1:9001</value>
     </property>
</configuration>
编辑masters
linux1
编辑slaves
linux2
linux3
8.       分别在上述3个节点机器上配置hadoop的环境变量
vi ~/.bashrc
export HADOOP_HOME=/home/lxw/hadoop-0.21.0
export PATH=$HADOOP_HOME/bin:$PATH
9.       启动HDFS和Mapreduce，并且查看集群状态
1)       格式化文件系统
hdfs namenode –format
hadoop namenode -format
2)       启动hadoop
start-dfs.sh
start-mapred.sh
3)       用jps命令查看进程，NameNode上的结果如下
10.   遇到的问题：
1） jobtraker没有起来：
java.lang.RuntimeException: Not a host:port pair: local
原因：mapred-site.xml 中mapred.jobtracker.address 需要改为：mapred.job.tracker
2） 9000端口没有打开 50070 50030
如果你的 conf/core-site.xml的配置是：
<configuration>
     <property>
         <name>fs.default.name</name>
         <value>hdfs://linux1:9000/</value>
     </property>
</configuration>
那么你应该将machine1的9000端口打开：
#iptables -I INPUT -p tcp --dport 9000 -j ACCEPT
然后可以查看
http://linux1:50070/dfshealth.jsp （你应该将500070端口也打开）

再执行，又报别的错：hdfs.DFSClient: Exception in createBlockOutputStream java.net.ConnectException: Connection refused
应该是datanode上的端口不能访问，到datanode上修改iptables：
#iptables -I INPUT -s linux1 -p tcp -j ACCEPT

OK 了！
3） /etc/hosts文件
不需要120.0.0.1 localhost
4） Cannot delete /home/lxw/hadoop-0.20.2/hadooptmp/mapred/system. Name node is in safe mode.
请不要急，NameNode会在开始启动阶段自动关闭安全模式，然后启动成功。如果你不想等待，可以运行：
bin/hadoop dfsadmin -safemode leave 强制结束。

猜你喜欢

转载自superlxw1234.iteye.com/blog/1483954

Hadoop集群安装笔记

Hadoop学习笔记1(集群安装部署)

【Hadoop】Hadoop 集群安装

hadoop学习笔记之hadoop伪集群安装

Hadoop集群的安装二安装hadoop集群

hadoop搭集群笔记

Hadoop集群安装

Hadoop集群的安装与布署

Hadoop集群及 Hive 安装

安装hadoop集群的步骤

Hadoop 集群安装

hadoop 集群安装及验证

docker安装hadoop集群

Hadoop 2.9 集群的安装

Hadoop集群的安装与部署

hadoop HA集群的安装

Hadoop集群安装教程

hadoop集群安装与部署

hadoop集群安装20181016

cdh 安装hadoop集群

Hadoop集群的安装与配置

Hadoop集群安装Pig

Centos安装Hadoop集群

Hadoop的集群安装

hadoop集群方式的安装

Hadoop安装（伪集群）

hadoop集群安装（翻译）

安装Hadoop集群

Hadoop安装与集群配置

安装hadoop集群--hdfs

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)