Apache Spark 简介 - 代码天地

Apache Spark 简介

其他 2020-01-12 13:50:18 阅读次数: 0

闪电般的统一分析引擎

Apache Spark™是用于大规模数据处理的统一分析引擎。

速度

运行工作负载的速度提高了100倍。

Apache Spark使用最先进的DAG调度程序，查询优化器和物理执行引擎，为批处理数据和流数据提供了高性能。

Hadoop和Spark中的逻辑回归

使用方便

使用Java，Scala，Python，R和SQL快速编写应用程序。

Spark提供了80多个高级操作员，可轻松构建并行应用程序。您可以从Scala，Python，R和SQL Shell 交互使用它。

df =火花。阅读。json （“ logs.json” ） df。其中（“年龄> 21” ）。选择（“ name.first” ）。显示（）

Spark的Python DataFrame API
通过自动模式推断读取JSON文件

概论

结合使用SQL，流和复杂的分析。

星火权力库，包括一叠 SQL和DataFrames，MLlib机器学习， GraphX和星火流。您可以在同一应用程序中无缝组合这些库。

无处不在

Spark可在Hadoop，Apache Mesos，Kubernetes，独立或云中运行。它可以访问各种数据源。

您可以在EC2，Hadoop YARN，Mesos或Kubernetes上使用其独立集群模式运行Spark 。访问HDFS， Alluxio， Apache Cassandra， Apache HBase， Apache Hive以及数百种其他数据源中的数据。

社区

Spark在各种组织中用于处理大型数据集。您可以在Powered By页面上找到许多示例用例。

有很多联系社区的方法：

使用邮件列表提问。
面对面的活动包括许多聚会小组和会议。
我们使用JIRA进行问题跟踪。

贡献者

Apache Spark由300多家公司的众多开发人员构建。自2009年以来，已有1200多名开发人员为Spark！做贡献

该项目的提交者来自25个以上的组织。

如果您想参加Spark或为它之上的图书馆做贡献，请学习如何贡献。

入门

无论您是来自Java，Scala，Python，R还是SQL背景，学习Apache Spark都很容易：

下载最新版本：您可以在笔记本电脑上本地运行Spark。
阅读快速入门指南。
了解如何在集群上部署 Spark。

daqiang012 博客专家

发布了362 篇原创文章 · 获赞 121 · 访问量 61万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/daqiang012/article/details/103935476

Apache Spark 入门简介

Apache Spark 简介

Apache Spark核心API简介

Apache Spark 内存计算框架简介

Apache Spark 中支持的七种 Join 类型简介

Apache Spark

【Python】PySpark 数据处理 ① ( PySpark 简介 | Apache Spark 简介 | Spark 的 Python 语言版本 PySpark | Python 语言场景 )

Spark简介

spark 简介

【Spark】简介

Apache简介

【SPARK】Spark Streaming简介

[Spark笔记]Apache Spark — Overview

Apache Spark Spark VS Hadoop

Spark、Python spark、Hadoop简介

Spark-01 spark简介

Spark 系列（一）—— Spark 简介

Spark 系列（一）—— Spark简介

Apache Spark 入门

[Apache Spark Error Message]

Apache Spark源码剖析

Apache Spark开发介绍

Apache Spark入门攻略

Apache Spark安装部署

Apache Spark机器学习

Apache Spark 概述

Apache Spark 初体验

Apache Spark 特点

Apache Spark RDD

Apache Spark 安装

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)