百度面试题(2018.10.29) 内容生态事业部

  1. 介绍自己的项目

  2. 项目的数据量有多大

  3. zookeeper在follower死掉后,如何重新选举?

  4. hdfs的数据存储和读取过程?

  5. hdfs在数据存储过程中,如何保证副本的数据一致性?

  6. 当时我没想起来,于是被问道,如果是你设计,你会如何实现hdfs数据写入的一致性?

  7. 如果hdfs在所有副本都把数据都写入完了,再记录元数据信息,会不会很慢?

  8. spark的yarn模式?

  9. 写代码,实现2个有序数组,合并成一个大的有序数组(想要考察join的知识点)?

  10. 写代码,实现以下业务逻辑:现如今有一个APP上线以来的所有日志数据,如何实现根据以前的日志数据,统计出现在每天/每小时的一个新增用户数据?

猜你喜欢

转载自blog.csdn.net/qq_41758289/article/details/83625748
今日推荐