《Spark核心源码分析与开发实战》读书笔记之一 - 代码天地

《Spark核心源码分析与开发实战》读书笔记之一

其他 2018-12-12 07:30:50 阅读次数: 0

第1章 Spark系统概述

1.1 Spark是什么

1. Spark比Hadoop快在哪里

（1）Spark使用内存计算，而Hadoop使用IO

（2）Hadoop的计算是按部就班一步一步进行的，而Spark则是提前生成了DAG，优化了运算路径

1.2 Spark生态系统BDAS

1. BDAS：伯克利数据分析栈

2. Spark Core

Spark将数据在分布式环境下分区，然后将作业转化为有向无环图（DAG），减少了多次计算之间中间结果I/O开销，并分阶段进行DAG的调度和任务的分布式并行处理。Spark采用容错的，高伸缩性的AKKA作为通信框架，减少了多线程并发运行所带来的不确定性。还采用多线程池模型来减少task的启动开销

RDD可以想象为一个个partition，RDD之间相互具有依赖关系

计算跟着数据走

3. Spark SQL

4. Spark Streaming：核心思想是微批处理

相对于Storm的优势：吞吐量更大，更高效的容错处理

5. Spark GraphX

核心抽象是：一种点和边都带有属性的有向多重图

6. MLlib

支持四种常见的机器学习问题：分类，回归，聚类和协同过滤

7. Tachyon

高容错，高性能的开源的分布式内存文件系统（内存中的HDFS）

8. BlinkDB

在海量数据上进行交互式SQL查询的大规模并行查询引擎

核心思想：通过一个自适应优化框架，随着时间的推移，从原始数据建立并维护一组多维样本，通过一个动态样本选择策略，选择一个适度大小的示例。

猜你喜欢

转载自blog.csdn.net/canglan211/article/details/83038455

《Spark核心源码分析与开发实战》读书笔记之一

需求分析与系统设计读书笔记之一

Redis开发与运维读书笔记之一

Java 8 实战读书笔记与源码

Spark权威指南读书笔记（一）

【读书笔记】Cronjob原理及源码分析

《Java开发实战经典》读书笔记

Koan《iphone游戏开发》读书笔记之一:游戏引擎揭秘

大规模web服务开发技术读书笔记之一

《maven实战》读书笔记（一）

机器学习实战-读书笔记(一)

《Redis实战》读书笔记（一）

《netty实战》读书笔记一

《STL源码剖析》读书笔记(一)

《REDIS设计与实现》读书笔记之一 SDS类型

shell脚本攻略读书笔记之一

《数据挖掘：概念与技术》读书笔记之一

读书笔记之一平米健身：硬派健身

《简明python教程读书笔记之一》

读书笔记之一个自己的房间

Java性能权威指南读书笔记--之一

读书笔记之一、《番茄工作法图解》

后台核心技术开发与应用实践读书笔记（一）

《后台开发核心技术与应用实践》第一章读书笔记

侯策《前端开发核心知识进阶》读书笔记——Javascript中的Closure（一）

《Android开发艺术探索》读书笔记——Toast调用流程的源码分析

《Flask Web开发》读书笔记(一)

SpringBoot实战（开发第一个应用程序）读书笔记

读书笔记——《Java核心技术卷一》——异常

风火编程--《python核心编程》读书笔记|(一)

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)