2018 大数据面试 内容事业部

baidu

  1. 介绍自己的项目
  2. 项目的数据量有多大
  3. zookeeper在follower死掉后,如何重新选举?
  4. hdfs的数据存储和读取过程?
  5. hdfs在数据存储过程中,如何保证副本的数据一致性?
  6. 当时我没想起来,于是被问道,如果是你设计,你会如何实现hdfs数据写入的一致性?
  7. 如果hdfs在所有副本都把数据都写入完了,再记录元数据信息,会不会很慢?
  8. spark的yarn模式?
  9. 写代码,实现2个有序数组,合并成一个大的有序数组(想要考察join的知识点)?
  10. 写代码,实现以下业务逻辑:现如今有一个APP上线以来的所有日志数据,如何实现根据以前的日志数据,统计出现在每天/每小时的一个新增用户数据?
     

猜你喜欢

转载自blog.csdn.net/love284969214/article/details/83649978
今日推荐