吐血整理,BAT 宝藏面经大公开~

作者 | 守着光的
来源 | 海边的拾遗者

写在前面

作者是研二的学弟,实力强悍的清北大佬一枚,研究方向与求职方向高度一致,为图机器学习/推荐系统,学弟本人非常有自己的想法,不光优秀还极其自律,不光收割了BAT,还尝试了难度较大的一些外企。话不多说,马上就献上这一份“珍藏版”面试记录,内容详实,有一定的门槛,具有很高的含金量。如下仅为部分面经,墙裂欢迎各互联网大佬来撩!

蚂蚁金服 | AILab

1、一面

自我介绍。

  • 介绍实习的工作,问了一些具体内容。

  • 了解哪些GNN, GAT和GCN的区别,如果图很稠密的话,对GAT有什么影响。

  • 两道easy的算法题,BST和二分。

  • 问我会不会一些传统的机器学习方法,比如xgboost, gbdt。

  • 深度学习优化器的区别,Adam和SGD。

  • Transformer的结构, positional embedding等。

面试完以后面试官说他挺满意的,介绍了下部门,说主要做图理论算法的。但是我当时比较想做应用业务,所以就让面试官就把我推荐到了他们经常合作的另一个部门了。

2、二面

到了蚂蚁第二个部门继续面试的流程。

自我介绍。

  • 介绍下以前的工作。

  • 讲下graph embedding的发展历史,有哪些有代表性的模型,都讲讲。

  • 给了两个蚂蚁的场景题,让我设计解决办法,说思路。

  • 反问。

总共不到半个小时,聊的感觉挺好的。面试体验很好。

3、三面

晚上10点多面的,自我介绍完后简单问了问项目和基础的ML问题,大概10分钟。

阿里妈妈

由于阿里只能最终在系统上选择一个进行投递,我选了蚂蚁,所以阿里妈妈这儿就停止了。

自我介绍。

  • 问了python语言的一些属性,list和tuple的区别。dict里key能否是list,如果自己改造的list可不可以作为dict的key。dict除了用hash实现还可以用什么实现。生成器,迭代器,装饰器。

  • 代码题:一个随机序列,找第k小的元素。最好的方法应该用quickselect,时间复杂度是O(n)。quickselect在之后边面别的公司的时候也被问了好多次,也算因祸得福了。

  • 聊了聊项目。

  • 问xgboost, gbdt原理及区别。

  • 反问。

字节跳动

1、一面30min

自我介绍。

  • 直接两道算法题:1.判断t2是不是t1的子树(说了暴力算法,面试官说还有更快的。被搞蒙了,结果发现他想要的就是暴力递归。最后面试官说我代码有问题,我说没问题,他检查了下说奥是他搞错了。紧张)2.编辑距离,没让写代码,说了下思路。就结束了。

2、二面50min

自我介绍。

  • 只聊了聊几个实习经历的工作,细节问了问。Focal loss公式。

  • 一道概率题:给一个木棍,切两刀,问可以组成三角形的概率。有点紧张,想了1分钟说了个错的答案。面试官就提示想想有几个变量?画到二维平面上?就想了到用线性规划,然后就做出来了,1/4。

  • 代码题:随机数组找第k大的元素。说了两种,1是用heap,2是quickselect。第二个更快,复杂度是O(n), 然后把第二种的code写了下,讲了讲。

3、三面30min

自我介绍。

  • 聊了聊,介绍了3段实习经历。

  • 代码题:类似leetcode岛屿连通的那道题。

4、HR面30min

聊天。

微软 | STCA

1、一面30min

自我介绍。

  • 代码题:1.链表排序 2.subarray sum equals k。半个小时写完code后开始聊项目。

  • 讲了实习时候做的工作。连带着相关细节数据集的采集,idea怎么做的等等。

  • 深度学习的相关知识,过拟合,cnn,rnn,lstm,激活函数,梯度消失梯度爆炸,batch normalization, adam 等等问了问。

  • 对面向对象熟悉不,有没有什么经验?

2、二面30min

自我介绍。

  • 代码题:给一个doc和一个摘要, 去查找doc里匹配摘要的位置(起始,结束)。能匹配多少就输出多少。比如doc是abc, 摘要是ba,那么b和a都是在doc里有所匹配的。如果可以匹配多个,则返回最长匹配。

一开始没理解题意,问师姐怎么划分摘要里的句子,用句号?后来明白了不需要划分,就硬匹配就行。面试官提示我建立一个倒排表,记录doc里每个字符出现的位置,才终于明白了。coding了一下讲了讲,算法就过了。面试官说ok,coding没问题算法就这样吧。

  • 介绍实习经历。简单聊了聊实习做的东西,大概十分钟。整个面试体验挺好的。

美团

1、一面40min

自我介绍。

  • 上来先介绍实习经历,项目。做法,细节,创新点都有问。从我做的东西出发,问了一些深度学习的问题,比如学习率,优化器,BN, LN, 梯度消失爆炸,过拟合,正则化的方法等。如果训练的时候不同batch之间loss差别很大可能是什么原因?当emebdding size特别大的时候怎么办?

  • 后边做了一道非常简单的题。给一堆学生,按成绩排序。

  • 问了python的语言特性,*args, **kwargs, yield,生成器,迭代器,python的垃圾回收机制。知不知道python多线程。python构造函数是啥?

2、二面40min

面试官看起来略微严肃,问了很多问题,问的很细。

自我介绍。

  • 聊项目,基础。

  • 还有一些发散性的问题。比如怎么由用户的外卖信息对用户作其他方面的推荐(比如旅游)。

  • 代码题:求topk小的数。

Amazon | SDE

1、一面

自我介绍。

  • 介绍项目。

  • 代码题:1.minstack 2.system design的题目,是最基础的LRU。但是当时没做过,靠着面试官提示,半个小时最后终于把思路说对了,没时间写代码了。

2、二面

介绍项目。

  • 代码题:给一个list,里边有一些time,比如23:59, 14:00, 让你返回里边最小的时间间隔。在面试官的指引下,最后把时间复杂度降到了O(n),因为实际上可能的time只有1440个。

这题回头看挺简单的,唉,但当时面试的时候自己好菜,就得靠面试官提示才到了最全,最优解。最后面试官说我potential还不错,他后边还要面很多人。等通知吧。

因为是SDE岗,感觉面试官倾向于聊计算机基础,比如网络,数据库之类的。

腾讯 | WXG

1、一面

自我介绍。

  • 写一个堆(好久不写了,都忘了堆了。写了40min才写完,发的那个在线coding的地方写代码会有重影眼花了都,写的有一点小问题,被check了一下,不过应该还ok)。

  • 问深度学习基础。上来问我为什么要引入激活函数。我说是为了非线性。他说错,根本原因是为了scale输出值防止梯度爆炸。我???然后问我sigmoid是非线性的吗,我说是啊非线性的。他说不,sigmoid,tanh都是线性的,relu才是非线性的。  我蒙蔽了,他又跟我讲一开始引入sigmoid为了scale值, 防止梯度爆炸/消失,balaba。我无语了只能同意他了。

  • 问batch size有什么用?大的batch有什么优点?

  • 问基于字和基于词的nlp方法有试过吗,哪个好?

  • BTE听说过吗,我以为他问的BCE,又仔细问了一遍,确定没听错是BTE。不知道,后来查了下也没查出来是啥。莫非想说bert?但他是一个一个字母读的,我也没听到r啊。

  • 问nlp里decoder出来unknown词怎么办。我说decoder的softmax那里应该把unknown mask掉的,就不会输出这个了。如果非要输出,就再训练一个模型学一下这个unknown应该是啥。他说ok吧。

  • 然后时间差不多快到了,就问我有啥问他的。我说有做推荐搜索的吗,对话这个方向可能不是很match,我不了解。他说也有做推荐搜索相关的,简单介绍了下。然后就结束了。

2、二面

刚开始自我介绍我说想做推荐搜索的,和对话系统不太匹配,面试官就把简历给HR推到比较合适的组了。

自我介绍。

  • 问了一个python的函数默认参数的问题。答错了,面试官让我打开命令行自己跑一下,然后给出解释,并且改成这个函数应该想达到的效果。然后连着调用两次append_list('one'),append_list('one'),问两次返回啥。应该['one'],  ['one', 'one']。函数如下:

def append_list(new_item,  a_list = []):    a_list.append(new_item)    return a_list

但是其实这个函数的功能是想两次都返回['one'],所以我改成了:

def append_list(*args):    if len(args) == 1:        return [args[0]]    args[1].append(args[0])    return args[1]
  • 代码题:找到两个list相交的点。    

  • 接下来半个小时主要针对我之前的工作聊了聊,包括一些细节。

  • 最后问了一个发散的问题。对于一个搜索query,如果这个query很长,里边很多没用的词,那么怎么提高搜索的准确度呢?我主要从模型上讲了讲,可以build一个模型来确定query里每个词的重要度,用cbow/self-attention之类的模型。

  • 最后面试官介绍了下他们团队,感觉不错,接下来等通知后续安排。

3、三面

自我介绍。

  • 介绍项目。

  • GNN发展史,GNN为什么可以work,GNN的数学原理。

  • self-attention的深层次原理是什么(不懂。。。),为什么work?

  • 代码题:一个单调栈的题,比较简单,他那边测了下test过了,然后就结束了。

4、HR面

自我介绍。

  • 问我你的缺点是什么?结果被追着问了好久,第一次有hr面要翻车的感觉。

不过好在hr最后说今天是腾讯提前批的最后一天,应该一会儿你就能看到状态更新,下周会发offer,看来是通过了。晚上11点多收到了短信说恭喜通过了所有面试,具体offer沟通下周进行。

快手

1、一面40min

自我介绍。

  • 机器学习/深度学习基础,问了好多,有一些不会。

  • 聊了聊项目,面试官对我做的方向不是太了解。

  • 代码题:带重复元素的sorted array里寻找最左端的target。

2、二面1h

一面通过了马上就开始二面,感觉这轮的面试官特别聪明有活力。感觉这轮主要考coding。

自我介绍。

  • 问了一些python的基础,list, tuple, dict, generator, derocator之类的。

  • 代码题:1.zigzag打印二叉树 2.给两个等长字符串,输出两个字符串之间的个数 3.给第三个字符串,求两字符串中间不包含第三个字符串的个数(leetcode上周周赛最后一题。太难了)不会做。就把第三个字符串简化为字符,和面试官讨论了一下。

Apple | Maps

一面20min

自我介绍。

  • 简单介绍了下简历项目,说接下来还有一轮过项目一轮coding。等通知

但是后边没消息了,应该是今年疫情的缘故,HC取消了吧。

总结

整个春招过程可以说经历地非常快了,体验也还可以,有失也有得,后面的路走一步看一步了。小编觉得优秀的人本质都是非常相似的,向优秀的人看齐才是正确的姿势,但是更优秀的人更努力的例子不值得我们更加努力学习吗。最后祝大家面试顺利,一起加油!欢迎大家来交流~

更多精彩推荐
☞离开一线互联网大厂的年轻人在想什么?
☞骚操作!用 CPU 烤肉,这位程序员做到了
☞部分美团用户被取消支付宝支付;腾讯成全球市值最高社交媒体公司;微软首次公布GitHub产品路线图 | 极客头条
☞一键实现图像、视频卡通化,GAN又进化了
☞SOA为什么不“香”了?| 大咖说中台
☞公链还能这样玩?二次元、出圈与社区自治
点分享点点赞点在看

猜你喜欢

转载自blog.csdn.net/csdnsevenn/article/details/107738994