Ubuntu上安装Hadoop集群 - 代码天地

Ubuntu上安装Hadoop集群

其他 2019-01-31 00:01:08 阅读次数: 0

原文地址： https://itweknow.cn/detail?id=67 ，欢迎大家访问。

前面我们介绍了在Ubuntu上安装Hadoop单机版。但是我们知道，Hadoop在实际工作中都是以集群的形式存在的，毕竟需要处理大量的数据，单机的处理速度显然不能满足。所以这篇文章我们就来介绍一下如何在Ubuntu上搭建Hadoop
集群。

准备阶段

三台在同一局域网内的Linux机器或者虚拟机。

配置好Host文件，让三台机器可以通过主机名进行访问。

三台机器上都安装了JDK。

在其中一台上安装好Hadoop，安装方法可以参考前面的文章。

配置SSH免密登录

你可能很奇怪我要搭建的是Hadoop集群，为啥需要配置SSH免密登录呢。有两点原因：

在启动集群上所有的节点的时候无需重复输入密码。
我们在搭建集群的时候需要将Hadoop的文件夹复制到其他机器上，如果是一两台的话copy起来很快，
但是如果是几百台呢，所以这个时候如果机器之间可以免密登录的话我们可以很方便的使用脚本完成整个工作。
具体的配置方式可以看下我之前的文章，SSH免密登录（内含批量配置脚本）

修改单机版的配置文件

修改core-site.xml，只需要修改fs.defaultFS配置项即可，hadoop.tmp.dir不需要修改。

<property>
    <name>fs.defaultFS</name>
    <!-- 修改为namenode的地址，改成主机名 -->
    <value>hdfs://test:9000</value>
</property>

修改``hdfs-site.xml`，主要是修改HDFS存储文件副本的数量，之前单机版的时候设置为1，现在改为2（这个配置项默认的配置为2）。

<!-- 指定HDFS副本的数量 -->
<property>
    <name>dfs.replication</name>
    <value>2</value>
</property>

安装包复制，并设置环境变量

其实在我们搭建好一台机器的Hadoop环境后只需要下面几步就可以完成集群环境的搭建了：

将Hadoop的安装目录拷贝到其他机器上。
在其他机器上配置Hadoop环境变量。
执行source /etc/profile命令，使得环境变量生效。
修改namenode的slave文件，指定datanode是哪几台机器

前面两步我写好了脚本，直接执行一下就可以了。第3步中说的slave文件在hadoop的安装目录下的etc/hadoop/slave，我这里用的test01和test02两台机器做datanode。

test01
test02

脚本地址
附上脚本使用说明

需要保证脚本文件夹中的两个脚本文件在同一目录下。

如果Hadoop的安装目录不为/root/apps/hadoop/hadoop-2.8.5，则需要修改脚本中hadoop的安装位置（两个脚本中都需要修改）。

修改脚本中机器名称，SERVERS变量。

环境启动

在namenode机器上执行下面的命令
```
start-all.sh
```
在浏览器中访问`http://{机器IP}:50070，查看到如下结果即代表成功。

猜你喜欢

转载自blog.csdn.net/sinat_27629035/article/details/85561666

Ubuntu上安装Hadoop集群

集群模式：在Ubuntu上安装Hadoop

Ubuntu上安装HADOOP单机伪分布式集群

Ubuntu 18.04.1上安装Hadoop 3.1.1集群详解

hadoop在ubuntu上的安装

ubuntu上hadoop的安装

ubuntu上安装 hadoop

【分布式】hadoop安装篇（8）在Ubuntu中使用CDH安装hadoop集群（上）

ubuntu中安装hadoop集群

在ubuntu上搭建hadoop服务（集群模式）

在Ubuntu上单机安装Hadoop

hadoop在ubuntu上的安装流程

Ubuntu上安装HADOOP多机完全分布式集群(转)

Ubuntu上安装HADOOP多机完全分布式集群

CentＯS 7上安装hadoop集群

centos 上安装hadoop和spark 集群

centos7上安装Hadoop集群

Hadoop 2.9.0 集群上安装Spark 2.4.0

Ubuntu下Hadoop的集群版的安装

为hadoop集群安装SSH（ubuntu 11）

Ubuntu 14.04下Hadoop集群安装

Ubuntu 16.04 VMware hadoop 2.7.4 集群安装

基于Ubuntu的Hadoop简易集群安装与配置

Ubuntu16 安装hadoop集群

Ubuntu 13.10 Hadoop集群安装记录

Ubuntu 16.04——Hadoop集群安装配置

【Hadoop】在Ubuntu系统下安装Hadoop集群安装

Linux上安装Hadoop集群(CentOS7+hadoop-2.8.0)

Linux上安装Hadoop集群(CentOS6.7+hadoop-2.8.3)

ubuntu上安装cdh3（hadoop）

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)