Spark生态系统

Spark自有生态圈(以Spark为核心)

● 1.3.0 及后续版本中,SchemaRDD 已经改名为DataFrame,DataFrame的概念来自于R语言

● 1.4才有Spark R,他是一个R语言包,它提供了轻量级的方式使得可以在R语言中使用Spark

● 1.6引入Dataset接口

更大的生态圈

 

如何对待

● 无需纠结谁替代谁(相互补充)

● 以某一个组件为突破口逐渐深入

● 大局观和生态意识

● 一切以应用场景为出发点

猜你喜欢

转载自blog.csdn.net/pigziprogrammer/article/details/94725781