大数据分布式存储操作 - 代码天地

大数据分布式存储操作

编程语言 2018-10-15 01:54:32 阅读次数: 0

大数据分布式存储操作
1.搭建集群
角色=进程
搭建集群的模式分为三种：
①伪分布式
在一台服务器上，启动多个进程，分别表示多个角色
②完全分布式
在多台服务器上，每台服务器启动不同角色的进程，使用多台服务器组成HDFS集群
block副本数+自己本身<=DataNode节点数
③高可用的完全分布式
因为namenode有可能会挂掉，所以在这中模式中，会对namenode做一个备份
2.搭建伪分布式
(1) 配置免密登录 node01->node01
① ssh-keygen -t dsa -P ‘’ -f ~/.ssh/id_dsa
② ssh-copy-id -i ~/.ssh/id_rsa.pub root@node01
(2) 配置JDK
① export JAVA_HOME=/opt/software/jdk/jdk1.8.0_151
② export PATH=$PATH:$JAVA_HOME/bin
(3) 修改hdfs-site.xml配置文件

	<property>
		<name>dfs.replication</name>
		<value>1</value>
	</property>

	<property>     
		<name>dfs.namenode.secondary.http-address</name>
		<value>node01:50090</value>
	</property>

(4)	修改core-site.xml配置文件
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://node01:9000</value>
	</property>
	<property>
		<name>hadoop.tmp.dir</name>
		<value>/var/abc/hadoop/local</value>
	</property>

(5)	修改slaves配置文件
	修改为node01
(6)	格式化NameNode(创建目录以及文件)     hdfs namenode -format
(7)	启动HDFS   start-dfs.sh
(8)	操作HDFS文件系统 
	①	创建目录 hdfs dfs -mkdir -p /user/root
	②	上传文件 hdfs dfs -put 如果存储的文件不足128M，那么该是多大就是多大，不会是128M
	③	删除目录 hdfs dfs -rm
	④	查看文件内容 hdfs dfs -cat(但是在实际情况中并不会用这个命令，以为它会直接加载所有的内容)
			    hdfs dfs -cat | more(常用)

猜你喜欢

转载自blog.csdn.net/dmbds20/article/details/82988909

大数据分布式存储操作

大数据分布式存储原理

大数据技术分布式存储 HDFS原理

大数据分布式文件存储系统~HDFS

MapGis如何实现WebGIS分布式大数据存储的

大数据背景下的分布式存储

大数据（分布式计算框架+分布式存储）

大数据导论（5）——大数据的存储（分布式、NoSQL、集群、CAP、ACID、BASE）

数据存储：大数据存储系统（1）--- 分布式文件系统

分布式存储、边缘数据存储

区块链分布式存储：生态大数据的存储新模式

大数据处理系统，分布式存储系统和分布式计算框架介绍

大数据分布式存储的部署模式：分离式or超融合

视频+全文|朱嘉明：大数据时代的危机与挑战 - 在DAO原则下构建分布式存储、分布式计算与分布式能源的未来...

大数据与分布式架构

大数据分布式内存

大数据分享之分布式

大数据伪分布式搭建

面向大数据的分布式调度

大数据分布式实战步骤

【大数据】分布式集群部署

【大数据】分布式计算

分布式数据存储算法

数据库分布式存储

分布式数据存储与管理

分布式数据存储--mycat

分布式存储中的数据冗余

大数据发展背后的强力推手——HBase分布式存储系统

大数据初学习之分布式存储HDFS理论概述

【大数据微职位笔记】模块04-分布式存储系统--HDFS

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)