大数据面试总结《五》

第一天面试:
下午1点半到公司(人人贷),公司做P2P,个人贷款,一共三轮面试,第一个技术偏向算法,第二个DBA,主要问sql和hive ql,第三个应该是公司负责技术方面的老大,问部分技术问题;
主要问题:
1 sql优化
设计角度 — 建索引,建视图
sql--------------- 充分利用索引,避免全表扫描
2 hive优化
充分利用临时表 , 重复利用
3 PageRank怎么实现

4 几道sql问题,联表查,exists,group by保留全部字段
5 不用hadoop 自己设计方案 实现TB级别数据量,TOP10问题,数据倾斜问题怎么解决
仿照mapreduce 的原理答复

6 算法中O(n)一定比O(lg(n))性能差吗?为什么?有那些因素需要考虑
没有答出来 , 面试官说还需要考虑IO,网络,空间等因素才能决定
第二家面试 (国舜科技)
1 如何搭建实时日志分析平台,需要那些条件
公司准备做的一个大数据平台,按业务去一步步做答
2 java 集合set list map 原理 区别 如何选择
3 k-means算法如何实现,为何收敛
为何收敛没有答出来

如有需要,可以添加博主微信,获取更多面试资料,或者向博主请教面试经验
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41045909/article/details/88856556