宜信大数据创新数据挖掘工程师面试经历

一面
qq电话,面了一个钟。
1.自我介绍

2.介绍一下流形学习算法
介绍了ISOMAP

3.介绍自己做的项目
讲了一下做的京东的用户购买预测比赛

4.比赛的追问
为什么用XGBOOST?
为什么最后用lightgbm?
lightgbm比XGBOOST好在哪?
xgboost也有基于直方图的优化,为什么还是比不上lightgbm?

5.概率题
给定一个6面色子,每个面的概率都是1/6,能够产生概率为1/5的事件吗
面试官的提示:把其中一面抹掉,抛到这面不算,继续抛。

6.概率题
还是那个色子,如何产生概率为pi/4的事件
利用正方形和圆面积的比值关系,抛色子产生点的坐标。

7.概率题
还是那个色子,如何产生概率为某小数的事件。

损失函数,交叉熵和最大似然是等价的吗

9.代码题
最大连续子序列和

二面
qq视频,面了50分钟
1 比赛用了什么评价指标,你调模型用了什么评价指标

2.给了一个评价指标,讨论它和最小平方误差的区别

3.归一化/标准化的方法

4.线性归一化与均值-方差归一化的区别

5.什么时候用归一化,什么时候不用

6.概率题
抛硬币,抛到正反都出现过才停止,问抛的次数的期望是多少。

7.概率题
打乒乓球赛,每一场a赢的概率是0.55,输的概率是0.45,a先赢够10场算赢,问a赢的概率。

8.概率题
给定坐标系上三角形三个点的坐标,怎么随机产生在三角形内的点。

9.关于SVM
说一下SVM
为什么要把SVM转化成对偶问题
对偶问题和原问题是等价的吗,为什么

10.LR
LR的损失函数是什么形式
LR比线性回归好在哪

猜你喜欢

转载自blog.csdn.net/whwan11/article/details/82707155
今日推荐