大数据敲门砖，想入行大数据必须学习这些知识 - 代码天地

大数据敲门砖，想入行大数据必须学习这些知识

其他 2018-11-05 02:20:19 阅读次数: 0

基础概念

大数据的本质

一、数据的存储：分布式文件系统(分布式存储)

二、数据的计算：分部署计算

基础知识

学习大数据需要具备Java知识基础及Linux知识基础

学习路线
大数据学习群142973723
(1)Java基础和Linux基础

(2)Hadoop的学习：体系结构、原理、编程

第一阶段：HDFS、MapReduce、HBase(NoSQL数据库)

第二阶段：数据分析引擎 -> Hive、Pig

数据采集引擎 -> Sqoop、Flume

第三阶段：HUE：Web管理工具

ZooKeeper：实现Hadoop的HA

Oozie：工作流引擎

(3)Spark的学习

第一阶段：Scala编程语言

第二阶段：Spark Core -> 基于内存、数据的计算

第三阶段：Spark SQL -> 类似于mysql 的sql语句

第四阶段：Spark Streaming ->进行流式计算：比如：自来水厂

(4)Apache Storm 类似：Spark Streaming ->进行流式计算

NoSQL：Redis基于内存的数据库

HDFS

分布式文件系统解决以下问题：

• 硬盘不够大：多几块硬盘，理论上可以无限大

• 数据不够安全：冗余度，hdfs默认冗余为3 ，用水平复制提高效率，传输按照数据库为单位：Hadoop1.x 64M，Hadoop2.x 128M

• 管理员：NameNode 硬盘：DataNode

MapReduce

基础编程模型：把一个大任务拆分成小任务，再进行汇总

• MR任务：Job = Map + Reduce

Map的输出是Reduce的输入、MR的输入和输出都是在HDFS

MapReduce数据流程分析：

• Map的输出是Reduce的输入，Reduce的输入是Map的集合
在这里插入图片描述

HBase

什么是BigTable?: 把所有的数据保存到一张表中，采用冗余 —> 好处：提高效率

• 因为有了bigtable的思想：NoSQL：HBase数据库

• HBase基于Hadoop的HDFS的

• 描述HBase的表结构

核心思想是：利用空间换效率.大数据学习群142973723
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_43403527/article/details/83046509

大数据敲门砖，想入行大数据必须学习这些知识

大数据学习的三个“敲门砖”

大数据学习的三个“敲门砖” 大数据学习的三个“敲门砖”

想入坑大数据？必须要规划学习路线

入行大数据，需要学习哪些基础知识？

入行大数据需要哪些知识呢？

想入行大数据，面对开发语言和分析软件时，该如何选择？

机器学习的敲门砖：kNN算法（下）

机器学习的敲门砖：kNN算法（中）

机器学习的敲门砖：kNN算法（上）

大数据学习知识

对于刚入行的大数据新手来说，需要学习哪些基本知识？

送给你的算法敲门砖

17年阿里敲门砖题目

学历是敲门砖能力是通天梯

Vue源码理解---敲门砖

Java反射---------通向高级的敲门砖

打造硬核敲门砖——简历

学历是敲门砖也是枷锁

学历：敲门砖还是枷锁？

学习大数据要掌握哪些语言？必须学习这些内容！！

大数据入行新手对机器学习的最佳学习路线

学习大数据必须了解的大数据开发课程大纲

大数据开发如何入门你必须知道这些

大数据可视化——这些必须知道的工具！

大数据技术扫盲，你必须会的这些点

入行大数据分析，怎么才能快速补充自己的大数据知识体系

个人入行大数据，快速构建自己的大数据知识体系，收藏了

学习大数据开发，那么关于hbase这些点就必须掌握！

入行大数据需要学习哪些编程语言

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)