大数据常见面试题(一)

知识点

  1. CurrentHashMap及CAS无锁算法(包括乐观锁及悲观锁)?
  2. BIO的缺陷与NIO的优势?
  3. 线程池的作用及特点,线程池各个参数的含义,常见的 CachedThreadPool 和FixedThreadPool的区别?
  4. Zookeeper特性、选举机制、脑裂?
  5. Hadoop不同版本之间模块的区别?
  6. HDFS读写删除及合并流程
  7. MapReduce计算原理?
  8. MapReduce的执行流程?
  9. yarn的作用、主要组件?
  10. hive内部表、外部表、分区表、分桶表?
  11. 数据库和数据仓库的特点对比?
  12. Hive的UDF?
  13. 非关系型数据库和关系型数据库?
  14. 行存储VS 列存储?
  15. Hbase写流程?
  16. Memstore发生flush的条件?
  17. 红黑树的画法、特征及修正过程?
  18. 解释Storm和Topology?
  19. Storm的并发级别?
  20. Storm的并发控制?
  21. 数据流分组方式?
  22. Storm可靠性?
  23. Spark中的窄依赖和窄依赖?
  24. Spark的Stage及处理流程?
  25. RDD容错机制?
  26. RDD持久化(缓存)?
  27. Spark Shuffle?
  28. Spark调优?
  29. Checkpoint机制?
    Hadoop常见面试题及答案原文链接

猜你喜欢

转载自blog.csdn.net/weixin_43980936/article/details/102490541