机器学习--评估指标

1 、损失函数种类

  • 0-1损失函数
    J(θ)=1Yf(x)
    J(θ)=0Y=f(x)
  • 感知损失函数
    J(θ)=1|Yf(X)|>t
    J(θ)=0|Yf(X)|<t
  • 平方和损失函数
    J(θ)=i=1m(hθ(x(i)y(i))2
  • 绝对值损失函数
    J(θ)=i=1m|hθ(x(i)y(i)|
  • 对数指标
    J(θ)=i=1m(y(i)loghθ(x(i)))

2 、性能指标

2.1 错误率与精度:

m个样本,有a个分错。
错误率: E=a/m
精度: acc=1a/m

2.2 查准率、查全率和F1:

TP:真正例 / TN:真反例
FP:假正例 / FN:假反例
查准率: P=TPTP+FP
查全率: R=TPTP+FN
F1是查准率和查全率的调和平均数:

1F1=12(1P+1R),F1=2×P×RP+R

与算术平均数相比,调和平均数更加重视较小值。如果对查全率和查准率有偏好,引出了加权调和平均数:
Fβ=(1+β2)×P×R(β2×P)+R

其中 β 大于1时候,查全率R有更大的影响,小于1时查准率P会有更大的影响。

2.3 ROC和AUC:

将m+个正例和m-个负例放进模型,然后预测值从小到大排列,模型目标是让正例尽可能小,负例尽可能大,从最小样例开始,如果是正例,就向上移一格,也就是 (x+1m+,y) ,坐标(0,1)就是所有正例都排在负例之前的理想情况,如果是负例就向右移动一格 (x,y+1m)
这里写图片描述
ROC曲线下的面积就是AUC值,AUC越接近1证明模型效果越好。

2.4 回归模型评价指标

MSE:均方差
MAE:平均绝对值误差
RMSE: MSE
TSS:总平方和,表示样本之间的差异情况。
RSS:残差平方和,表示预测值和样本值之间的差异情况
R2 :取值范围(负无穷,1],值越大表示模型越拟合训练数据;最优解是1;当模型预测为随机值的时候,有可能为负;若预测值恒为样本期望,为0

R2=1RSSTSS=1(yiŷ i)2(yiy)2

3 、评估方法

3.1 留出法

划分出互斥的训练集和测试集,注意两个集合的分布尽量保持一致,通常采用分层采样的方法。通过若干次的随机划分得到比较稳定可靠的结果。

3.2 交叉验证法

p次k折的交叉验证法,就是k-1个子集作为训练集,剩下的1个作为测试集。

3.3 自助法

有放回的采用,产生更多的测试机,bootstrapping,同时有一部分的数据不会被采集到,可以作为外包估计。

猜你喜欢

转载自blog.csdn.net/xiayto/article/details/79793925