机器学习第二章

ROC和RUC

学习器为测试样本产生一个实值或概率预测,然后将这个预测值与一个分类阈值进行比较,若大于阈值则分为正类,否则分为反类;

ROC(受试者工作特征  横轴-真正例率(TPR)  纵轴-假正例率(FPR))

TPR=TP/(TP+FN)     FPR=FP/(TN + FP);

绘图过程:

给定m+个正例和m-个反例,根据学习器的预测结果对样例进行排序,然后把分类阈值设为最大,即把所有样例均预测为反例;

若为真正例,则上移1/m+单位;

若为假正例,则右移1/m-单位。

这样恰恰说明了为什么横轴就表示FPR,纵轴就表示TPR。

经过(m+ add m-)次的猜测,就得到从(0,0)到(1,1)的折线ROC。

对每个点作关于x,y轴的直线,将该区域分成 m+ mulpitly m- 块小矩形。

在ROC曲线之下的面积是AUC(Area Under ROC Curve)

经过(m+ add m-)次的猜测,就得到从(0,0)到(1,1)的折线ROC。

对每个点作关于x,y轴的直线,将该区域分成 m+ mulpitly m- 块小矩形。

 思考:对于不同的排序而言会产生灰色区域的误差;因此需要考虑f(x+)=f(x-)的误差;

ROC曲线上方的面积等于m-块底为1/m-,高为1/m+ multiple (剩余的正例数目),并考虑排序带来的影响

故  得到书上的损失公式。

猜你喜欢

转载自www.cnblogs.com/Damocless/p/11771413.html