大数据Hadoop学习笔记(五)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/yuanyi0501/article/details/83031614

分布式部署

  • 本地模式Local Mode
  • 分布式Distribute Mode
    • 伪分布式
      • 一台机器运行所有的守护进程
      • 从节点DN和NM只有一个
    • 完全分布式
      • 有多个DN、NM
      • 在配置文件&HADOOP_HOME/etc/hadoop/slaves中配置

三台机器:

192.168.220.133 hdp-node-01 3g 1核CPU
192.168.220.131 hdp-node-02 2G 1核CPU
192.168.220.132 hdp-node-03 2G 1核CPU

配置映射:/etc/hosts

192.168.220.133 hdp-node-01
192.168.220.131 hdp-node-02
192.168.220.132 hdp-node-03

安装

分布式的集群配置在192.168.220.130 机器的/opt/app文件夹中

服务规划:

. hdp-node-01 hdp-node-02 hdp-node-03
HDFS NameNode . SecondaryNameNode
. DataNode DataNode DataNode
YARN ResourceManager
. NodeManager NodeManager NodeManager
MapReduce JobHistoryServer

配置:

分发节点 SCP协议:

  • 配置ssh无密钥登陆
    cd .ssh/
    如果没有ssh目录运行:ssh localhost
    ssh-copy-id hdp-node-02
    ssh-copy-id hdp-node-03
  • 分发
    scp -r ./hadoop-2.5.0/ root@hdp-node-02:/opt/app/
    scp -r ./hadoop-2.5.0/ root@hdp-node-03:/opt/app/
  • 在02机器上配饰ResourceManager
    删除02、03ssh目录下所有文件
    在01机器上重新ssh-copy-id hostname
    在02机器上运行命令:
    ssh-keygen -t rsa(加四个回车)
    ssh-copy-id hdp-node-02
    ssh-copy-id hdp-node-01
    ssh-copy-id hdp-node-02

启动:

  • [root@hdp-node-01 hadoop-2.5.0]# bin/hdfs namenode -format
  • [root@hdp-node-01 hadoop-2.5.0]# sbin/start-dfs.sh
    • 在这里插入图片描述
  • [root@hdp-node-01 hadoop-2.5.0]# sbin/mr-jobhistory-daemon.sh start historyserver
  • [root@hdp-node-02 hadoop-2.5.0]# sbin/start-yarn.sh

集群搭建完成之后(面试常问):

  • 基本测试
    • 服务是否启动,能否完成简单的应用
    • hdfs
      • 读写操作
      • bin/hdfs dfs -mkdir -p 目录
      • bin/hdfs dfs -put 文件路径 存放路径
      • bin/hdfs dfs -text 文件目录
    • yarn
      • 运行一个程序 run jar
    • mapreduce
      • bin/yarn jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.5.0.jar wordcount /user/root/mapreduce/wordcount/input/word.input /user/root/mapreduce/wordcount/output
  • 基准测试
    • 测试集群的性能
      • hdfs
        • 写数据
        • 读数据
  • 监控集群
    • cloudera
    • cloudera manager
      • 可以辅助我们部署安装
      • 监控集群
      • 对集群进行配置、同步(如:时间同步)、更新、预警等等

猜你喜欢

转载自blog.csdn.net/yuanyi0501/article/details/83031614