【大数据面试基础题】

         今天领导有事,让我去面试人,第一次面试人,有些小紧张,不过还是去当面试官了,首先问了一下招聘需求,明确了需求才可以对症下药--招聘大数据,然后开始进行了面试,首先让对方自我介绍,介绍项目经历,然后开始技术讨论,说是面试,其实就是技术交流,交流完毕问了一下对方有啥想问我的,最后问了一下对方期望工资,需要和领导沟通一下,让对方等通知,最后把面试情况反馈相关人。

1、大数据常用的组件有哪些?

 

2、storm消息是怎么流入,流出的?

 

3、我们知道hadoop中有NameNode/DataNode的类似主从的节点,strom中对应的叫什么?

 

4、storm搭建环境完毕,通常需要启动哪几个服务,怎么启动各个服务(启动命令是什么)

 

5、storm怎么部署一个开发的程序到环境中,即我现在开发了一个程序打包好了,如何启动(即启动命令是什么)

 

6、storm开发中遇到过问题没有,怎么解决的呀?

 

7、zookeeper常见的端口是什么?各有什么作用?

 

8、zookeeper开发中遇到过问题没有,怎么解决的呀?

 

9、ES检索数据的方式?

 

10、ES如何优化?

 

11、 多个group by如何提高性能 ?

 

12 、ES有哪几种工作节点?

 

13 、ES遇到过问题没有,怎么解决的呀?

 

14、kafka监听的默认端口是?消息默认保存多久 ?kafka由哪几部分组成?

 

15、kafka是分布式的,通过哪个属性区分各个节点?

 

16、kafka工作原理即数据怎么流入流出?

 

17、kakfa消息是否可以重复消费,创建topic的shell脚本名字是什么?

 

18、使用过哪些缓存系统?如何避免缓存穿透?

 

19、redis默认的端口是什么?有哪些数据类型?

 

20、SQL语句的优化方式?

 

21、数据清洗,采集组件有哪些(ETL, Flume, Sqoop)?使用场景?

 

22、Hbase组件对应的主从节点分别叫什么呀?

 

23、Hbase使用过程中遇到什么问题没有?获取数据的命令有几种?

 

猜你喜欢

转载自gaojingsong.iteye.com/blog/2307302