大数据面试真题整理

蚂蚁金服面试题

  1. 小文件的合并
  2. MR与Spark的区别
  3. 关注哪些名人的博客
  4. 对大数据领域有什么自己的见解
  5. 平常怎么学习大数据的
  6. StringBuilder与StringBuffer的区别
  7. HashMap与Hashtable的区别
  8. 谈谈你对数的理解
  9. 数据库索引的实现
  10. jvm的内存模型
  11. jvm的垃圾收集器
  12. jvm的垃圾收集算法
  13. HDFS架构
  14. HDFS读写流程
  15. Hadoop3.0做了哪些改进
  16. 谈谈YARN
  17. 为什么项目选择Spark,你觉得Spark的优点在哪里
  18. 了解Flink与Storm吗,它们与Spark Streaming的区别在哪里
  19. 1TB文件,取重复的词,top5指定的资源的场景下,如何快速统计出来

猜你喜欢

转载自blog.csdn.net/weixin_42741866/article/details/84327200