面试公司:字节跳动
面试岗位:大数据开发
一面题:
• 自我介绍数仓维度建模
• 深挖事实表维度表构建spark join
• mapreduce原理
• spark 常用算子
• map flatmap
• 有没有实际做过数仓项目
算法题:
给定数组包含正负数(数量至多差1),要求将其排列成正负彼此相邻形式,要求时间复杂度O(N),空间复杂度O(1)
二面题:
• 自我介绍
• 介绍实习项目
• ·数据倾斜怎么解决的
• 如果需要变回原来粒度怎么办
算法题
- 1-N个数字,找出字典序第K大的数字,要求空间O(1),时间O(K),举例1-19字典序为1,10,11,12,13,14,15,16,17,18,19,2,3,4,5,6,7,8,9
写过hive没有?
来个hive题
spark区别来个题
- 两个栈模拟队列
要高效主动介绍实验室项目
• 反问
三面题:
• 自我介绍
• 模拟彩票抽奖中奖,每个人有n张票,有100个奖品
• 介绍当前面试界面涉及的网络技术
• 介绍最近一个有挑战的项目
• 最近学习上的计划安排