思考:
为什么Spark可以后来居上于Hadoop?
(1)Spark本身框架就是使用Scala写的,而Scala运行于JVM上,Hadoop也是基于Java的,所以Spark可以很好的兼容Hadoop的一些优点
(2)众所周知,Spark是基于内存的,Hadoop是基于磁盘的,在数据读取方面,Spark肯定要快
思考:
为什么Spark可以后来居上于Hadoop?
(1)Spark本身框架就是使用Scala写的,而Scala运行于JVM上,Hadoop也是基于Java的,所以Spark可以很好的兼容Hadoop的一些优点
(2)众所周知,Spark是基于内存的,Hadoop是基于磁盘的,在数据读取方面,Spark肯定要快