bigo
逻辑回归特征离散化优点 特征离散化方法
什么是过拟合 过拟合解决
参数估计
分奖金
二叉树每一层的最大值
有一个数在数据组中出现次数超过一半 最小复杂度找出来
n方矩阵 顺时针排列
hive join map reduce阶段 过程
hive TXT文件建表 国家省城市
广告渠道Abc 广告订单成本 123 广告收益 efg 假设最大成本x 求满足的最大收益
泛化误差Bias(偏差),Error(误差),Variance(方差)及CV(交叉验证)
Error = Bias^2 + Variance+Noise
- 什么是Bias(偏差)
Bias反映的是模型在样本上的输出与真实值之间的误差,即模型本身的精准度,即算法本身的拟合能力
- 什么是Variance(方差)
Variance反映的是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。反应预测的波动情况。
- 什么是Noise(噪声)
这就简单了,就不是你想要的真正数据,你可以想象为来破坏你实验的元凶和造成你可能过拟合的原因之一,至于为什么是过拟合的原因,因为模型过度追求Low Bias会导致训练过度,对测试集判断表现优秀,导致噪声点也被拟合进去了
作者:mrlevo520
链接:https://www.jianshu.com/p/8d01ac406b40
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。
2,逻辑回归多重共线性的解决办法
https://blog.csdn.net/nieson2012/article/details/48980491
3 判别模型,生成模型,
https://blog.csdn.net/haolexiao/article/details/70217607
l1,l2正则l1,l2正则
4,过拟合和解决办法
http://lib.csdn.net/article/machinelearning/33798
5,逻辑回归特征离散化优点,特征离散化方法
https://blog.csdn.net/u010358304/article/details/80693541
6,参数估计方法及区别