寒假之大数据学习笔记（0） - 代码天地

寒假之大数据学习笔记（0）

其他 2020-01-24 10:48:32 阅读次数: 0

本人现大二计算机学生，想将自己学的东西，写成博客，供大家分享，日后也将持续更新。

寒假里主要整理大数据和java方面的知识。

（大数据开发技术）学习路线如下：

环境：Linux操作系统（CentOS）
（1）Hadoop:解决海量数据的分布式存储，分布式计算
（2）Hbase:大数据的数据库列式存储的数据
（3）Hive:数据仓库（数据库一般存储在线交易数据，数据仓库存储的一般是历史数据。）
（4）scala:函数式编程
（5）Spark:准时时计算的一个框架
（6）SparkSQL:为Spark提供结构化数据处理
（7）SparkStreaming:流式计算
（8）Flume:数据采集
（9）Kafka:消息队列
（10）Python:面向对象爬虫

storm:是一个免费并开源的分布式实时计算系统(过时)
flink:以数据并行和流水线方式执行任意流数据程序

其中

（1）、（2）、（3）属于离线计算，主要用在处理数据量大，但不急于计算的情况

（5）、（6）、（7）、（8）、（8）属于实时计算，主要用在边存入边处理的数据

（4）、（10）是两种独立的语言

基于hadoop，以上各个技术组成hadoop生态圈

hadoop生态圈

由zookeeper这个技术来管理这个生态圈

zookeeper：管理协调

（每学习一个新的技术就放入zookeeper里面）

发布了7 篇原创文章 · 获赞 2 · 访问量 363

私信关注

猜你喜欢

转载自blog.csdn.net/qq_43935969/article/details/104054329

寒假之大数据学习笔记（0）

寒假之大数据学习笔记（1）

寒假之大数据学习笔记（2）

大数据学习笔记之大数据概述

寒假大数据学习笔记一

寒假大数据学习笔记十

寒假大数据学习笔记十四

寒假大数据学习笔记十三

Java之大数据学习路线

（一）hadoop学习之大数据简介

大数据学习之大数据简介03

hadoop之大数据

java学习之大数计算

system design之大数据

大数据技术之大数据概论

大数据时代之大数据概念

黑马大数据学习笔记0-环境配置

深入浅出学习大数据：核心篇之大数据分析！

大数据专业技术学习之大数据处理流程

大数据入门培训之大数据开发基础知识学习

好程序员大数据学习路线之大数据自学路线一

好程序员大数据学习路线之大数据自学路线二

01云计算与大数据学习之大数据环境下的云计算架构习题

02云计算与大数据学习之大数据关键技术与应用习题

02云计算与大数据学习之大数据关键技术与应用

人工智能之大数据

理论篇之大数据篇

简单介绍之大数据框架

Linux之大数据集群部署

社交媒体之大数据挖掘

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)