即将发布的 Apache Spark 2.4 都有哪些新功能 - 代码天地

即将发布的 Apache Spark 2.4 都有哪些新功能

其他 2018-10-31 10:42:15 阅读次数: 0

本文来自于2018年09月19日在 Adobe Systems Inc 举行的 Apache Spark Meetup。

即将发布的 Apache Spark 2.4 版本是 2.x 系列的第五个版本。本文对 Apache Spark 2.4 的主要功能和增强功能进行了概述。

新的调度模型（Barrier Scheduling），使用户能够将分布式深度学习训练恰当地嵌入到 Spark 的 stage 中，以简化分布式训练工作流程。
添加了35个高阶函数，用于在 Spark SQL 中操作数组/map。
新增一个新的基于 Databricks 的 spark-avro 模块的原生 AVRO 数据源。
PySpark 还为教学和可调试性的所有操作引入了热切的评估模式（eager evaluation mode）。
Spark on K8S 支持 PySpark 和 R ，支持客户端模式（client-mode）。
Structured Streaming 的各种增强功能。例如，连续处理（continuous processing）中的有状态操作符。
内置数据源的各种性能改进。例如，Parquet 嵌套模式修剪（schema pruning）。
支持 Scala 2.12。

关注 iteblog_hadoop 公众号，并回复 spark24 获取本文 PPT。

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

640?wx_fmt=jpeg

猜你喜欢

欢迎关注本公众号：iteblog_hadoop:

回复 spark_summit_201806 下载 Spark Summit North America 201806 全部PPT

0、回复 电子书 获取 本站所有可下载的电子书

1、Apache Spark 统一内存管理模型详解

2、Elasticsearch 6.3 发布，你们要的 SQL 功能来了

3、Spark Summit North America 201806 全部PPT下载[共147个]

4、干货 | 深入理解 Spark Structured Streaming

5、Apache Spark 黑名单(Blacklist)机制介绍

6、Kafka分区分配策略(Partition Assignment Strategy)

7、Spark SQL 你需要知道的十件事

8、干货 | Apache Spark 2.0 作业优化技巧

9、[干货]大规模数据处理的演变(2003-2017)

10、干货 | 如何使用功能强大的 Apache Flink SQL

11、更多大数据文章欢迎访问https://www.iteblog.com及本公众号(iteblog_hadoop) 12、Flink中文文档： http://flink.iteblog.com 13、Carbondata 中文文档： http://carbondata.iteblog.com

640?wx_fmt=png

猜你喜欢

转载自blog.csdn.net/b6ecl1k7BS8O/article/details/82836588

即将发布的 Apache Spark 2.4 都有哪些新功能

Apache Spark 2.4 回顾以及 3.0 展望

Spark 2.4 正式发布，重要功能详细介绍

Apache Spark 3.0 发布

Apache Spark 2.4 内置的 Avro 数据源实战

【译】Apache spark 2.4:内置 Image Data Source的介绍

Apache Spark 2.4 内置图像数据源介绍

#Apache Spark系列技术直播# 第六讲【 What's New in Apache Spark 2.4? 】

Apache2.4开启GZIP功能

Apache Spark 1.5.0正式发布

Angular 6.0正式版发布，都有哪些新功能

Angular 6正式版发布，都有哪些新功能

社区活动 | Apache Flink 1.9 版本即将发布，新版本有哪些新特性？

Apache Commons VFS 2.4 发布，虚拟文件系统库

Android 12 有哪些新功能？开发人员测试版本即将发布

Apache Spark 2.4 新增内置函数和高阶函数使用介绍

spark 2.4安装

Spark 2.4 standalone 部署

apache2.4 安装

apache2.4配置

编译安装Apache 2.4

安装apache httpd 2.4

网站优化之Apache2.4GZIP功能

Apache Spark 3.0 预览版正式发布，多项重大功能发布

Apache Bahir 2.3.3 发布，扩展 Spark 与 Flink

.NET for Apache Spark 1.0 版本发布

Apache Spark

Apache Spark 2.1.0正式发布，Structured Streaming有重大突破

Enscape 2.4新功能预览

spark2.4 on yarn安装

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)