前言
下午5点多,来了一个座机电话,一看杭州座机电话的,以为外地的骚扰电话,当时正在看算法,停了2秒,对方开口了,说是阿里的,我浑身一个机灵,心想完了,没准备,昨天才线上笔试,效率真高,我预计得等一两个星期,,才排到我,.学的比较简陋low B.进入正题.,
(自己毫无准备,和预计面试时间相差过多,全程懵逼状态)
问题
1.开始问我最近在做什么!!!!划重点
后面所以回答都是基于我这个问题的回答展开的,我不敢说高了,刚吃过晚饭,很饱很懵逼的那种,其实最近都是在弄基础的.所以就如实回答了,
说了几个关键词: 数据分析,numpy,pandas,matplotlib(JS网页绘图),特征工程,scikit-learn库,卷积,CNN,等等,然后说昨天刚码了一个卷积神经网络来识别验证码的,,以前做过表情识别的,(想说做过文本分类,情感分析,等等,的,但是感觉可能会懵逼,状态不好,就没说),然后搭建一些简单的神经网络,学习一些基础的API,
2.基于上面的回答,回答的很low,当时心想估计面试官会当场笑出来,但是面试官没有,很和蔼,很谦虚的那种,
面试官又问到,那你简单说说验证码识别,遇到的问题,
答:我就说了,在one_hot时候遇到的问题,在加载数据和形状转换时候遇到的bug
3面试官又问了,简单说下数据集,训练的思路,准确率等等
答:此部分回答也如实说的
4 面试官问了用的什么框架,卷积时候形状的改变过程,卷积核的设计,模型的主要架构是什么,batch 和batch_size,等等
答:如实回答,提到了dropout
5. 面试官又问,你知道怎么计算损失的吗,怎么避免过拟合吗,什么是batch_nomalization吗,等一系列问题,一时间忘了,反正都是深度学习入门的概念和知识,此处省略了很多深度学习的基础问题,
答:过拟合防止:利用dropout冻结神经元,损失:优化器-梯度下降法,很多基础的没有答上来,事实上都看过,有点手推过,一时懵逼,了,没有答上来,
6 .面试官有问了,前面你提到了特征工程,请你说下做过的项目
答:房价预测,股价预测,入住率预测,等分类和回归的一些小的实践
7面试官又问了,那你知道,svm是什么,能简单说说原理吗? SVM和LR有什么区别,他们有什么共同点,什么不同点,各自的优势,等等简单说下. KNN思想,?实践中如何利用KNN来构建模型的预测入住率的? 问了一些机器学习入门问题
8 面试官说,我们主做NLP的,你知道有哪些NLP算法吗,简单的说下,听说你了解Wordvec吗,后面又问了,Word2vec原理,如何计算词向量的,层次softmax原理,
,(很后悔,此处没有想起来,感觉此处我可以加分的,NLP基础的我都是自学过的,做过文本分类和微博情感分析 ,并且了解Fastext等算法,看过基础和前沿的一些NLP论文,像语言模型之前都是细看过的,感觉很多我知道的都可以说说的,,但是都没有想起来提,)
答:CRF,HMM,我只说了两个crf,hmm,听说你了解Wordvec吗后面都没想起来说,当说到,连续词袋模型和跳步模型的如何训练词向量和如何计算损失的时候卡住了,反正很后面,当时毫无思路,整个一个懵逼树上懵逼果.
9.面试官看我很多没有回答上来,场面一度很尴尬,面试官就和蔼的说,差不多,要不就这样,最后你还有什么想问的吗?
答:我说好的 ,谢谢,我想问下目前您部门有涉及到语音内的吗,? 文本和语音有交叉到吗,? 还有想了解下您部门,在机器学习等前沿的相关算法和技术,?,面试官又很和蔼的说了下,
总结
1.所提的问题涉及的知识:从基层的机器学习算法,到深度学习,到相关的应用,从特征工程构建,到模型架构,到NLP相关概念和应用.
2.大多数都是你提到什么,他展开话题,所以知道的就都说出来,尽量展现所学的,
3,全程我面临的一个问题是,我的思路不清晰,简单的想KNN算法都想不起来,欧氏距离天天挂在嘴边,我都想不起来,理清思路,淡定,很关键.
4.要发挥自己的优点, 比如问到你了解NLP的时候,自己就可以多说说,但是都没想起来提下...,所以,明确自己掌握的知识点,发挥自己的优点,
5.一定要提前做好功课,不然很简单的都不一定能答上来,让自己有个准备,复习下所学.
6后记,面试的大哥哥语气很和蔼,但是又不失气魄...让我想起了以前面的一个AI音响的公司,全程微笑,温和,...