机器学习算法的基础知识

1、评估指标

预测值
0 1
实际 0 TN FP
1 FN TP
  • a c c u r a c y = T N + T P T N + T P + F P + F N accuracy = \frac{TN+TP}{TN+TP+FP+FN}
  • p r e c i s i o n = T P T P + F P precision= \frac{TP}{TP+FP}
  • r e c a l l = T P T P + F N recall= \frac{TP}{TP+FN}
  • F 1 = 2 ( p r e + r e c ) p r e + r e c F1= \frac{2*(pre+rec)}{pre+rec}
  • ROC曲线: X F P R = F P F P + T N Y T P R = T P T P + F N X轴:FPR=\frac{FP}{FP+TN};Y轴:TPR=\frac{TP}{TP+FN}

2、偏差与方差(过拟合与欠拟合)

E r r o r = B i a s + V a r i a n c e Error=Bias+Variance

  • E r r o r Error :整个模型的准确度
  • B i a s Bias :模型在样本上的输出与真实值之间的误差(即模型本身的精度)
  • V a r i a n c e Variance :每次输出结果与模型输出期望之间的误差(即模型的稳定性)
    在这里插入图片描述

3、正则化(解决过拟合)

在这里插入图片描述

  • L1正则化产生稀疏特征
  • L2产生更多特征但都会接近于0

4、梯度下降算法(算法优化方式)

在这里插入图片描述

5、数据不平衡

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/weixin_41851055/article/details/106229013