大数据概况，关于大数据你不得不知道的基础知识 - 代码天地

大数据概况，关于大数据你不得不知道的基础知识

其他 2020-07-26 12:41:28 阅读次数: 0

一、大数据的特征

4V特征
Volume(大数据量)：90% 的数据是过去两年产生
Velocity(速度快)：数据增长速度快，时效性高
Variety(多样化)：数据种类和来源多样化
结构化数据、半结构化数据、非结构化数据
Value(价值密度低)：需挖掘获取数据价值
固有特征
时效性
不可变性

二、关于hadoop

hadoop是如何进行分布式处理呢？
1.数据存储：分布式存储，分成多块存储
2.存储结束后，进行分布式数据的处理

说了这么多，什么是hadoop？
Hadoop是一个开源分布式系统架构
分布式文件系统HDFS——解决大数据存储
分布式计算框架MapReduce——解决大数据计算
分布式资源管理系统YARN
处理海量数据的架构首选
非常快得完成大数据计算任务
已发展成为一个Hadoop生态圈

hadoop又有哪些优点是我们使用它的理由呢？
高扩展性，可伸缩
高可靠性
多副本机制，容错高
低成本
无共享架构
灵活，可存储任意类型数据
开源，社区活跃

看一下hadoop的生态圈吧，百度这些知识点，可以更加有效的有针对性的去学习！
在这里插入图片描述
稍作分类：
Hadoop核心
HDFS、MapReduce、YARN
数据查询分析
Hive、Pig、Impala、Presto
协调管理
HCatalog、Zookeeper、Ambari
数据迁移
Sqoop、Flume
Spark、NoSQL、机器学习、任务调度等
由这些介绍可以更加有针对性的对自己想要工作的地方学习！

三、hadoop的结构

HDFS(Hadoop Distributed File System)
分布式文件系统，解决分布式存储
MapReduce
分布式计算框架
YARN
分布式资源管理系统
在Hadoop 2.x中引入
Common
支持所有其他模块的公共工具程序

了解完这些基本知识后，我们就要开始进一步的有针对性的学习！下一篇会进行关于hadoop的单机搭建和集群构造！

猜你喜欢

转载自blog.csdn.net/weixin_42507474/article/details/107013320

大数据概况，关于大数据你不得不知道的基础知识

关于wifi你不得不知道的知识

Kafka面试你不得不知道的基础知识

[不得不知道系列]Java线程面试你不得不知道的基础知识一

你不得不知道的知识-零拷贝

大数据时代|Hadoop和Spark，那些你不得不知道的关系与区别，助你尽情徜徉智能时代

你不得不知道的互联网软件的两种模式【多易教育】【大数据入门学习】

关于服务熔断你不得不知道的知识

关于websocket你不得不知道的知识点

你不得不知的Java基础知识

你不得不知道的事之----redis数据持久化

你不得不知道的 MySQL 优化原理

maven,你不得不知道的something!

你不得不知道的上架app

你不得不知道的PID控制算法

数据分析必备｜你不得不知道的11款数据分析工具

学习大数据需要掌握的知识（不得不看）

HTML | 行内元素与块级元素你不得不知道的知识点

【Java小知识】垃圾回收GC你不得不知道的事情

Servlet入门详细教程（你不得不知道的Servlet知识点）

Java月入30k，这些你不得不知道的知识（一）

关于JS你不得不知道的几个小算法。（-）

关于磁珠在PCB应用中你不得不知道的这几点

关于成功，你不得不知道的三大残酷真相

关于线程池你不得不知道的一些设置

关于Spring Boot你不得不知道的事--Spring Boot的基本操作

关于Filecoin你不得不知道的5大问题 | 星际无限

最熟悉的陌生人，那些关于String你不得不知道的东西

关于 StatefulWidget，你不得不知道的原理和要点

关于VScode插件，你不得不知道的几件事

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)