Spark自有生态圈(以Spark为核心)
● 1.3.0 及后续版本中,SchemaRDD 已经改名为DataFrame,DataFrame的概念来自于R语言
● 1.4才有Spark R,他是一个R语言包,它提供了轻量级的方式使得可以在R语言中使用Spark
● 1.6引入Dataset接口
更大的生态圈
如何对待
● 无需纠结谁替代谁(相互补充)
● 以某一个组件为突破口逐渐深入
● 大局观和生态意识
● 一切以应用场景为出发点
● 1.3.0 及后续版本中,SchemaRDD 已经改名为DataFrame,DataFrame的概念来自于R语言
● 1.4才有Spark R,他是一个R语言包,它提供了轻量级的方式使得可以在R语言中使用Spark
● 1.6引入Dataset接口
● 无需纠结谁替代谁(相互补充)
● 以某一个组件为突破口逐渐深入
● 大局观和生态意识
● 一切以应用场景为出发点