9月汇总,大数据开发,顺丰,贝壳,阿里,快手,京东,网易云

前言:

记录一下9月秋招情况,八月初开始一直进行笔试面试,几乎每天都有,从七月面试凉了后就开始海投(投了70家左右了),大致的进展如下,感觉今年池子尤其的深。
岗位:大数据开发,数据开发
顺丰科技: 1-2-HR,已OC
贝壳找房:1-2-HR,已接到HR电话
阿里菜鸟:1-2-3-HR,等结果
快手科技: 1-2-3-HR,等结果
京东:1-2-HR,等结果
网易云:1-2-HR,开奖没开到
一点资讯: 1-2-3-HR,等结果
有赞:1-2-HR,等结果
VIPKID: 1-2-HR(今天HR)
本文分享给需要面试刷题的朋友,也祝愿大家顺利拿到自己想要的offer,这份资料主要包含了Java基础,数据结构,jvm,多线程等等,由于篇幅有限,以下只展示小部分面试题,有需要完整版的朋友可以点一点链接跳转领取:链接:点击即可!!!暗号:CSDN在这里插入图片描述

小米:一面凉

腾讯pcg后端:一面凉,没看到大数据岗,投的后端,一直问后端凉, 手撕代码也写不出来
跟谁学:一面凉,也问好多后端,手撕代码也写不出来
其他的就是:笔试后没结果的,拼多多,老虎证券,哔哩哔哩,科大讯飞,滴滴,爱奇艺,携程,4399,等等好多笔试都挂掉
还有简历挂掉的:猿辅导,百度,作业帮,好未来等
个人情况:
本科黑龙江末流二本,研究生末流985,实习主要写SQL
技术相关:JAVA,MySQL,Linux,Hadoop,Hive,HBase,Flume,Kafka,Kylin,对离线数仓熟悉,Spark和Flink了解一点点,简历上几乎没怎么写

面经:

有10多天没整理面经了,上午整理了一些。可能有好多问题,大概整理一下,还有的没整理出来

顺丰科技: 一面

项目介绍
技术选型
维度,指标,讲了二期三期主题
Kylin和Presto和Druid区别看一看
报表可视化
数据小为啥不用关系型数据库
Kylin的雪崩
遇到过得比较大的挑战?业务对接,Kylin的Bug
对大数据的理解
数据仓库,Hive的执行引擎mr,Tez,Spark
mr和Tez会出现啥问题,适合什么样的场景,Tez底层
数据倾斜
Hbase的rowkey设计
排序算法
Java基础,线程上下问切换,资源消耗问题
垃圾回收算法

二面

介绍项目
Kylin的优势,构建Cube非常复杂
Presto和Druid
Kylin的Cube存在Hbase上
Shuffle的过程
数据倾斜问题,
Group by 和 Reduce by?
Group by 和 Order by 执行过程
Group by 和 Distinct的区别
Flume和Kafka用在项目中
数仓介绍一下,数仓分层,每层做什么事
数据的实效性,
Hadoop集群的规模
数据量大小
数据的版本,发版策略
未来三年的规划,三年能达到什么的高度?
反问环节
大数据的几个方向
你想做啥?
数据量几十个T左右
工作地点考虑

三面

个人介绍
接触大数据技术?平常自主学习?
数学建模和挑战杯的内容?
读研究生给你带来的最大收获?
为什么选择顺丰科技?发展?
城市选择问题?
家人对工作地点有什么意见吗?
行业的选择?
顺丰科技的了解?为什么选择?
手中有别的offer吗?
家人给你带来的帮助?收获?
职业规划?
反问?

贝壳 : 一面(8.15. 23分钟)

1.数据仓库相关,主要是问项目中的
2.数据仓库横向(是指分层),他问我纵向怎么划分(是主题吗?我就把实习项目中做的主题和他说了说)
3.写SQL(rank 函数) 公司人员成本表a,有三个字段 月份date( 格式:2020-05) 、成员name、成本amt.2019年各成员成本排名
4.写SQL(连表,然后group by) 公司部门表 b 有两个字段 人名name、部门department ;部门每月的成本。
5.问项目中表的情况
6.实习中用的kylin,构建,还有优化(使用维度聚合之类,我只知道简单的)
7.问clickhouse,我不知道,presto我实习中用的是kylin也不知道。
8.遇到的问题,社区版kylin有很多bug(在7070的web界面写SQL,遇到过的一些异常,零除和连表的一些问题)
9.做的系统给谁用,给集团和各个事业部的
10.项目中数据的校对,怎么做的。
11.反问环节

二面(8.15. 31分钟)

1.问实习项目中做的工作,我主要写建数据模型,写kylin SQL
2.围绕项目展开的,实习项目中数仓相关,为什么分层,维度建模,什么是维度(让我解释,懵逼)
3.写下面的执行顺序
select
from
where
group by
having
order by
limit
执行顺序
我当时写的有些问题,然后我就按照自己想法解释了一通,大致没问题
4.让我把上面的SQL对应到MR里面
就是MR的输入输出对应啥,
我把MR中的分组,排序大概说了说对应上,要对MR中map(),reduce()和shuffle熟悉,之前18年写MR程序写的多,写过的话就会知道了
5.Hive的优化,常用的说,我大概说了6-7条,有说了2条Hadoop
6.数据倾斜解决,我大概说了3条

反问环节


HR面(8.15. 18分钟)
1.为什么做大数据,想做那个方向?
2.项目中做了啥,收获
3.项目担任角
4.问本科期间做的比赛,数学建模和挑战杯
5.工作地点
6.选择公司考虑什么
7.面了哪些公司
8.对贝壳的了解
9.反问环节
10.对薪资的期望
11.能不能实习

快手:一面:8.10

1.说一下shuffle过程
2.分区是根据啥分区的,自定义分区
3.数据倾斜产生
4.做join的倾斜问题
5.map join 的原理
6. 调整map数和reduce数,怎么调?
7.数仓建模的问题,自己说
8.HashMap的实现
9.快速排序 实现,时间复杂度,稳定性。
10,区间合并的题,LeetCode

反问环节

二面:8.11

自我介绍
1.比较有挑战的事情?
2.项目问题
3.核心指标,从每一期指标说了说
4.指标对不上问题,数据对不上
5.数仓整个过程
6.数据量大小
7.数仓,写SQL
工作地点
反问工作

扫描二维码关注公众号,回复: 11640562 查看本文章

面试到45分钟

三面 8.18(1个小时)

都是自己说
1.java基础封装继承多态
2.集合相关,list和map那些
3.线程相关,自己说
4.数据库
5.HDFS
6.MR
7.Hive
8.项目介绍
9.大数据学习过程
10.
现在有大学考试成绩如下表A:
id,subject,score
找出每一科都是这一科前30%的学生的id

HR面8.26

一开始约的牛客面,后来公司网络问题,那边改成电话,正常问题,忘记录音

网易云大数据 : 一面(8.14. 46分钟)

不自我介绍直接开始
Hadoop
存储
MR和shuffle
reduce分三个阶段,你怎么分
资源调度
Hive执行流程(SQL转MR过程)
ZK的原理 paxos一致性算法
进程和线程区别
内存模型
锁的机制,什么时候用到锁,

写代码:
1.删除无序链表中值重复出现的节点 选择换题
2.单链表的选择排序 选择换题
3.翻转字符串(2) AC
4.括号字符串的有效性 AC


二面(8.18. 31分钟)

不自我介绍直接开始
1.直接问项目,做了啥,问一下数据建设情况
2.对Kylin的了解
3.做的系统给谁用,可视化用的啥
4.实习中开发工作的流程
5.Cube的优化,减少膨胀率
6.项目中主要做的工作写SQL
7.写SQL,我记得一个是用rank求排名的,一个是用explode函数,把数组炸裂开,让一行变多行的,然后连表
8.hive优化相关,SQL书写优化,连表优化等,hive的调参数优化等
9.每天跑数的时候,任务挂掉了,怎么搞?(实习中没搞过,一顿瞎扯)
10.HBase,写数据流程
11.大数据啥时候学的,为什么往这个发展
12.另一个项目的数据来源,我爬虫得到的
13.职业规划,反问


三面(8.20. 25分钟)

1.实习项目参与情况
2.有成就感的事情,顺着吧项目说了说
3.项目组开发人员情况
4.遇到困哪
5.平常的学习过程
6.项目中那些需要改进和提升
7.为什么往大数据发展
8.职业规划
9.兴趣爱好
10.听音乐的类型
11.用网易云听
12.最大的挫折
13.有什么优点,缺点
14.面试了那些
15.工作地点,有没有女朋友
16.反问

京东 : 一面:8.12

就10分钟面试
1.自我介绍
2.项目
3.岗位要做什么
4.数据库的原理,关系型数据库理论知识
5.转到数仓,分仓
6.学生干部经历
7.实习情况?
8.反问环节?

二面:8.18

没录音,记不太清了
1.最有成就感事情
2.数仓建模
3. 累计快照事实表

HR面,8.27

把我鸽了,第二天又面得,也没录音,8分钟结束,正常问题
邮箱收到通知说审批,审批过了就有,没过就感谢信

总结:

8月份也面了不少,感觉现在手里没面得大厂剩美团,百度这些了,还有别的欢迎补充。
祝大家能收获心仪的offer。
觉得有用的点赞,收藏支持一下,面经后续整理继续更新。

猜你喜欢

转载自blog.csdn.net/a3961401/article/details/108522489
今日推荐