机器学习算法校招笔试面试题集

bigo

逻辑回归特征离散化优点 特征离散化方法

什么是过拟合  过拟合解决

参数估计

分奖金

二叉树每一层的最大值

有一个数在数据组中出现次数超过一半 最小复杂度找出来

n方矩阵 顺时针排列

hive join map reduce阶段 过程 

hive TXT文件建表 国家省城市 

广告渠道Abc 广告订单成本 123 广告收益 efg 假设最大成本x 求满足的最大收益

泛化误差Bias(偏差),Error(误差),Variance(方差)及CV(交叉验证)

Error = Bias^2 + Variance+Noise

  • 什么是Bias(偏差)

Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,即算法本身的拟合能力


  • 什么是Variance(方差)

Variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。反应预测的波动情况。


  • 什么是Noise(噪声)

这就简单了,就不是你想要的真正数据,你可以想象为来破坏你实验的元凶和造成你可能过拟合的原因之一,至于为什么是过拟合的原因,因为模型过度追求Low Bias会导致训练过度,对测试集判断表现优秀,导致噪声点也被拟合进去了


作者:mrlevo520
链接:https://www.jianshu.com/p/8d01ac406b40
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。

2,逻辑回归多重共线性的解决办法

https://blog.csdn.net/nieson2012/article/details/48980491

3 判别模型,生成模型,

https://blog.csdn.net/haolexiao/article/details/70217607

l1,l2正则l1,l2正则

4,过拟合和解决办法

http://lib.csdn.net/article/machinelearning/33798

5,逻辑回归特征离散化优点,特征离散化方法

https://blog.csdn.net/u010358304/article/details/80693541

6,参数估计方法及区别

https://blog.csdn.net/ch1209498273/article/details/78313859

猜你喜欢

转载自blog.csdn.net/a1084958096/article/details/82777429