大数据学习笔记之Hadoop安装步骤详解 - 代码天地

大数据学习笔记之Hadoop安装步骤详解

企业开发 2019-05-16 08:20:47 阅读次数: 0

一般大数据集群都是由Hadoop组成的，本文的最终目标是安装和配置两台Ubuntu服务器，让他们组成Hadoop的集群。

首先要安装vmware workstation虚拟软件，这个安装方法和一般的软件一样，这里附一个安装版本，供大家下载。

1、用vmware workstation建立虚拟机，开始先不选择安装包

内存选择：如果本机是4G内存，则分配虚拟机1G内存

webp

2、按默认要求来，完成虚拟机的初步配置

对大数据以及人工智能概念都是模糊不清的，该按照什么线路去学习，学完往哪方面发展，想深入了解，想学习的同学欢迎加入大数据学习qq群：458345782，有大量干货（零基础以及进阶的经典实战）分享给大家，让大家了解到目前国内最完整的大数据高端实战实用学习流程体系。从java和linux入手，其后逐步的深入到HADOOP-hive-oozie-web-flume-python-hbase-kafka-scala-SPARK等相关知识一一分享！

webp

3、开始ubuntu的安装

选择镜像文件（我用的版本也在上面的网盘里下载），然后一步步的安装

webp

4、选择电脑名称为hd1，密码为123456。注意Your name设置为ubuntu

webp

5、打开Ubuntu虚拟机，打开终端编辑器

webp

6、安装并进入VMware Tools。安装通过点击虚拟机->安装VMware Tools进行安装。

webp

7、复制VMware Tools的压缩包到另一个文件目录下。这里放到了tmp目录下。

webp

8、解压VMWare Tools

webp

9、解压后进入vmware-tools-distrib

webp

10、继续编写命令进行安装 sudo./vmware-install.pl

webp

11、安装VMware Tools成功

webp

12、利用 sudo aptinstall vim安装vim。安装完成后如下图。

webp

13、输入reboot重启，同时重启后输入init 0关闭虚拟机

14、复制hd1文件夹，命名为hd2，放在存虚拟机的文件夹下

15、用记事本打开hd2文件夹下的hd1.vmx。修改其中的displayName为hd2.

再用VMware WorkStation打开hd1.vmx

webp

16、分别启动两台虚拟机

webp

17、根据电脑的ip配置/etc/hosts文件，给IP地址一个别名，方便后面操作。注意ip地址为你两台虚拟机的ip地址。用ifconfig命令可以查看本机IP。一般是191.168.开头的一串IP地址。我配置如下。

sudo vim /etc/hosts

192.168.241.132 hd1

192.168.241.130 hd2

webp

18、安装openssh-server

webp

19、启动ssh

webp

20、保证每次开机时自动启动ssh

webp

21、多机互信，两台虚拟机都要执行ssh-keygen-t rsa命令。

webp

22、进行密钥的互信，两台虚拟机都要执行cat id_rsa.pub >> authorized_keys命令。

webp

23、将hd1的文件拷到hd2上，同时把hd2的文件拷到hd1上

webp

24、验证已经实现双机互信

webp

25、在hd1上进行hadoop的安装

webp

26、在hd1和hd2上进行java的安装。

两台主机都要执行sudo apt install default-jre命令。

webp

27、在hd1和hd2上分别进行相关目录的创建

webp

接下来需要配置hadoop集群文件

配置文件有7个：

/home/ubuntu/hadoop/hadoop/etc/hadoop/hadoop-env.sh

/home/ubuntu/hadoop/hadoop/etc/hadoop/yarn-env.sh

/home/ubuntu/hadoop/hadoop/etc/hadoop/slaves

/home/ubuntu/hadoop/hadoop/etc/hadoop/core-site.xml

/home/ubuntu/hadoop/hadoop/etc/hadoop/hdfs-site.xml

/home/ubuntu/hadoop/hadoop/etc/hadoop/mapred-site.xml

/home/ubuntu/hadoop/hadoop/etc/hadoop/yarn-site.xml

28、配置env文件。28-34步只在hd1上完成

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-amd64/

export HADOOP_HOME=/home/hadoop/hadoop

webp

29、配置yarn-env文件

export JAVA_HOME=/usr/lib/jvm/java-1.8.0-openjdk-amd64/

webp

30、配置slave文件

hd1

hd2

webp

31、配置core-site文件

<property>

<name>fs.defaultFS</name>

<value>hdfs://hd1:9000</value>

</property>

<property>

<name>io.file.buffer.size</name>

<value>131072</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>file:/home/ubuntu/hadoop/tmp</value>

</property>

<property>

<name>hadoop.proxyuser.hduser.hosts</name>

<value>*</value>

</property>

<property>

<name>hadoop.proxyuser.hduser.groups</name>

<value>*</value>

</property>

webp

32、配置hdfs-site文件

<configuration>

<property>

<name>dfs.namenode.http-address</name>

<value>hd1:50070</value>

</property>

<property>

<name>dfs.namenode.secondary.http-address</name>

<value>hd1:9001</value>

</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>file:/home/ubuntu/hadoop/namenode</value>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>file:/home/ubuntu/hadoop/hdfs</value>

</property>

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

<property>

<name>dfs.webhdfs.enabled</name>

<value>true</value>

</property>

<property>

<name>dfs.support.append</name>

<value>true</value>

</property>

<property>

<name>dfs.support.broken.append</name>

<value>true</value>

</property>

<property>

<name>dfs.permissions.enabled</name>

<value>false</value>

</property>

</configuration>

webp

33、配置mapred-site文件

注意先将mapred-site.xml.template文件拷出，然后再使用vim命令

webp

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>hd1:10020</value>

</property>

<property>

<name>mapreduce.jobhistory.webapp.address</name>

<value>hd1:19888</value>

</property>

【大数据开发学习资料领取方式】：加入大数据技术学习交流群458345782，点击加入群聊，私信管理员即可免费领取

webp

34、配置yarn-site文件

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<property>

<name>yarn.resourcemanager.address</name>

<value>hd1:8032</value>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>hd1:8030</value>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>hd1:8031</value>

</property>

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>hd1:8033</value>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>hd1:8088</value>

</property>

webp

35、在hd1和hd2上配置路径文件。执行下面两条命令

sudo vim /etc/profile

export PATH=$PATH:/home/ubuntu/hadoop/hadoop/bin:/home/ubuntu/hadoop/hadoop/sbin

webp

36、在hd1上加入hadoop路径到path路径下

webp

37、在hd1上格式化namenode，执行hadoop namenode -format命令

webp

38、在hd1上进行文件的分发，注意命令行当前所在的位置。

webp

39、验证是否安装成功

在hd1上建一个a.txt文件

webp

拷到hdfs文件里面去

webp

打印显示

webp

自此安装成功

推荐阅读文章

大数据工程师在阿里面试流程是什么？

学习大数据需要具备怎么样基础？

年薪30K的大数据开发工程师的工作经验总结？

猜你喜欢

转载自blog.51cto.com/14217196/2395235

大数据学习笔记之Hadoop安装步骤详解

大数据学习笔记之Hadoop（四）：Hadoop-HA

大数据之：hadoop1.x安装详解

大数据学习——hadoop安装

大数据之hadoop（一）安装hadoop

大数据环境搭建步骤详解（Hadoop，Hive，Zookeeper，Kafka，Flume，Hbase，Spark等安装与配置）

大数据学习笔记（二）-hadoop安装【原创】

「大数据学习笔记」1.2 Linux Hadoop的安装与配置

大数据环境搭建之Hadoop伪分布式Linux环境搭建步骤详解

大数据学习笔记之Hadoop-HDFS

大数据学习笔记之Hadoop（二）：HDFS文件系统

大数据学习笔记——Hadoop编程实战之HDFS

大数据学习笔记——Hadoop编程实战之Mapreduce

大数据学习笔记02----Hadoop之HDFS

大数据技术学习笔记之Hadoop框架基础4-MapReduceshuffer过程详解及zookeeper框架学习

大数据Hadoop学习之了解Hadoop

Linux下基于Hadoop的大数据环境搭建步骤详解（Hadoop，Hive，Zookeeper，Kafka，Flume，Hbase，Spark等安装与配置）

大数据技术学习笔记之Hadoop框架基础3-网站日志分析及MapReduce过程详解

大数据组件之----HIVE，win10下安装以及配置hadoop详细步骤

(一)大数据环境准备：Hadoop安装步骤

(三)大数据环境准备：Hive安装步骤(依赖Hadoop)

大数据面试题之Hadoop集群搭建步骤

hadoop学习笔记之hadoop集群搭建详细步骤

大数据hadoop入门之hadoop家族详解

大数据Hadoop学习笔记（六）

大数据Hadoop学习笔记（五）

大数据Hadoop学习笔记（四）

大数据Hadoop学习笔记（三）

大数据Hadoop学习笔记（二）

大数据Hadoop学习笔记（一）

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)