Apache Spark之RDD详解 (章节二)

版权声明:未经作者允许,不允许用于任何商业用途 https://blog.csdn.net/weixin_38231448/article/details/89473040
作者:jiangzz电话:15652034180微信:jiangzz_wx微信公众账号:jiangzz_wyRDD概述Spark计算中一个重要的概念就是可以跨越多个节点的可伸缩分布式数据集RDD(resilientdistributeddataset)Spark的内存计算的核心就是RDD的并行计算。RDD可以理解是一个弹性的,分布式、不可变的、带有分区的数据集合,所谓的Spark...
作者:jiangzz 电话:15652034180 微信:jiangzz_wx 微信公众账号:jiangzz_wy RDD概述 Spark计算中一个重要的概念就是可以跨越多个节点的可伸缩分布式数据集 RDD(resilient distributed dataset) Spark的内存计算的核心就是RDD的并行计算。RDD可以理解是一个弹性的,分布式、不可变的、带有分区的数据集合,所谓的Spark

猜你喜欢

转载自blog.csdn.net/weixin_38231448/article/details/89473040
今日推荐