1. 1.准备Linux环境

1.0 设置虚拟软件

点击VMware快捷方式，右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段：192.168.1.0 子网掩码：255.255.255.0 -> apply -> ok

回到windows --> 打开网络和共享中心 -> 更改适配器设置 -> 右键VMnet1 -> 属性 -> 双击IPv4 -> 设置windows的IP：192.168.1.100 子网掩码：255.255.255.0 -> 点击确定

在虚拟软件上 --My Computer -> 选中虚拟机 -> 右键 -> settings -> network adapter -> host only -> ok

1.1修改主机名

vim /etc/sysconfig/network

NETWORKING=yes
HOSTNAME=node ###

1.2修改IP

两种方式：
第一种：通过Linux图形界面进行修改（强烈推荐）
进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections ->
选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 -> method选择为manual ->
点击add按钮 -> 添加IP：192.168.1.101 子网掩码：255.255.255.0 网关： 192.168.1.1 -> apply

第二种：修改配置文件方式（屌丝程序猿专用）
vim /etc/sysconfig/network-scripts/ifcfg-eth0

DEVICE=“eth0”
BOOTPROTO=“static” ###
HWADDR=“00:0C:29:3C:BF:E7”
IPV6INIT=“yes”
NM_CONTROLLED=“yes”
ONBOOT=“yes”
TYPE=“Ethernet”
UUID=“ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c”
IPADDR=“192.168.1.101” ###
NETMASK=“255.255.255.0” ###
GATEWAY=“192.168.1.1” ###

1.3修改主机名和IP的映射关系

vim /etc/hosts

192.168.1.101 node

1.4关闭防火墙

#查看防火墙状态
service iptables status
#关闭防火墙
service iptables stop
#查看防火墙开机启动状态
chkconfig iptables --list
#关闭防火墙开机启动
chkconfig iptables off

为普通用户添加sudo命令
敲入命令：su，该命令可以让我们切换到root用户——>敲入命令：visudo，
visudo命令是用来编辑修改/etc/sudoers配置文件——>找到如下一行:root ALL=(ALL) ALL
添加一行：lfy ALL=(ALL) ALL——>刷新配置，source /etc/profile

1.5重启Linux

reboot

2.安装JDK

2.1

上传alt+p 后出现sftp窗口，然后put d:\xxx\yy\ll\jdk-7u_65-i585.tar.gz

2.2

解压jdk
#创建文件夹
mkdir /home/lfy/Myapp
#解压
tar -zxvf jdk压缩包 -C /home/lfy/Myapp

2.3

将java添加到环境变量中
vim /etc/profile
#在文件最后添加
export JAVA_HOME=/home/hadoop/app/jdk-7u_65-i585
export PATH= $PATH:$ JAVA_HOME/bin

#刷新配置
source /etc/profile

3.安装hadoop2.4.1

先上传hadoop的安装包到服务器上去/home/lfy/
注意：hadoop2.x的配置文件$HADOOP_HOME/etc/hadoop

到/home/lfy/Myapp/hadoop-2.4.1/etc/hadoop目录下修改相应的配置文件
伪分布式需要修改5个配置文件

3.1配置hadoop(一共5个文件)

第一个：vim hadoop-env.sh
#第27行
export JAVA_HOME=/home/lfy/Myapp/jdk1.8.0_151

第二个：vim core-site.xml

fs.defaultFS hdfs://node1:9000 hadoop.tmp.dir /home/lfy/Myapp/hadoop-2.4.1/tmp

第三个：vim hdfs-site.xml hdfs-default.xml (3)

dfs.replication 1

第四个：vim mapred-site.xml (mv mapred-site.xml.template mapred-site.xml)
mv mapred-site.xml.template mapred-site.xml
vim mapred-site.xml
<! 指定mr运行在yarn上 >

mapreduce.framework.name
yarn

第五个：vim yarn-site.xml

yarn.resourcemanager.hostname node1 yarn.nodemanager.aux-services mapreduce_shuffle

3.2将hadoop添加到环境变量

vim /etc/profile
	export JAVA_HOME=/usr/java/jdk1.7.0_65
	export HADOOP_HOME=/node/hadoop-2.4.1
	export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile

3.3格式化namenode（是对namenode进行初始化）

	hdfs namenode -format (hadoop namenode -format)

3.4启动hadoop

	先启动HDFS
	sbin/start-dfs.sh
	
	再启动YARN
	sbin/start-yarn.sh

3.5验证是否启动成功

	使用jps命令验证
	27408 NameNode
	28218 Jps
	27643 SecondaryNameNode
	28066 NodeManager
	27803 ResourceManager
	27512 DataNode

	http://192.168.2.101:50070 （HDFS管理界面）
	http://192.168.2.101:8088 （MR管理界面）

4.配置ssh免登陆

4.1（机器A）生成密钥

	ssh-keygen -t rsa （四个回车）
	执行完这个命令后，会在主目录/home/lfy/.ssh下生成两个文件id_rsa（私钥）、id_rsa.pub（公钥）
	查看文件：ll -a

4.2 注册公钥

	cp id_rsa.pub authorized_keys

4.3 将公钥拷贝到要免登陆的机器上

	scp id_rsa.pub 主机B名:/root/.ssh

4.4 在主机B上面，把公钥（id_rsa.pub）放到授权列表里面

touch authorized_keys; cat ~/id_rsa.pub > authorized_keys;

4.5 设置authorized_keys只有当前用户读-写：chmod 600 authorized_keys

ssh-copy-id localhost

5.Hadoop运行项目命令

hadoop jar 项目名 源文件路径 输出文件路径 
hadoop jar /opt/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /Hadoop/Input /Hadoop/Output

注：

Hadoop开启关闭调试信息

开启：export HADOOP_ROOT_LOGGER=DEBUG,console
关闭：export HADOOP_ROOT_LOGGER=INFO,console

hadoop2.4.1伪分布式环境搭建

1. 1.准备Linux环境

1.0 设置虚拟软件

1.1修改主机名

1.2修改IP

1.3修改主机名和IP的映射关系

1.4关闭防火墙

1.5重启Linux

2.安装JDK

2.1

2.2

2.3

3.安装hadoop2.4.1

3.1配置hadoop(一共5个文件)

3.2将hadoop添加到环境变量

3.3格式化namenode（是对namenode进行初始化）

3.4启动hadoop

3.5验证是否启动成功

4.配置ssh免登陆

4.1（机器A）生成密钥

4.2 注册公钥

4.3 将公钥拷贝到要免登陆的机器上

4.4 在主机B上面，把公钥（id_rsa.pub）放到授权列表里面

4.5 设置authorized_keys只有当前用户读-写：chmod 600 authorized_keys

5.Hadoop运行项目命令

注：

猜你喜欢

hadoop2.4.1伪分布式环境搭建

1. 1.准备Linux环境

1.0 设置虚拟软件

1.1修改主机名

1.2修改IP

1.3修改主机名和IP的映射关系

1.4关闭防火墙

1.5重启Linux

2.安装JDK

2.1

2.2

2.3

3.安装hadoop2.4.1

3.1配置hadoop(一共5个文件)

3.2将hadoop添加到环境变量

3.3格式化namenode（是对namenode进行初始化）

3.4启动hadoop

3.5验证是否启动成功

4.配置ssh免登陆

4.1（机器A）生成密钥

4.2 注册公钥

4.3 将公钥拷贝到要免登陆的机器上

4.4 在主机B上面，把公钥（id_rsa.pub）放到授权列表里面

4.5 设置authorized_keys只有当前用户 读-写：chmod 600 authorized_keys

5.Hadoop运行项目命令

注：

猜你喜欢

4.5 设置authorized_keys只有当前用户读-写：chmod 600 authorized_keys