Python计算AUC - 代码天地

Python计算AUC

其他 2019-10-21 10:34:07 阅读次数: 0

AUC（Area under curve）是机器学习常用的二分类评测手段，直接含义是ROC曲线下的面积。另一种解释是：随机抽出一对样本（一个正样本，一个负样本），然后用训练得到的分类器来对这两个样本进行预测，预测得到正样本的概率大于负样本概率的概率。
在有M个正样本,N个负样本的数据集里，利用公式求解：
\[ AUC=\frac{\sum_{i \in positiveClass} rank_i-\frac{M(1+M)}{2}}{M*N} \]
在python实现中，相当于使用了计数排序，因为概率是一个小数，我们同时乘以100取整数进行排序（也可以根据精度调整）。在排完序后，我们就可以得到正样本概率大于负样本概率的个数，再加上正样本概率等于负样本概率的个数的一半，除以总共的样本数（M*N），即可得到最终的AUC值。

def AUC(labels,preds,n_bins=100):
    m = sum(labels)
    n = len(labels) - m
    total_case = m * n
    pos = [0 for _ in range(n_bins)]
    neg = [0 for _ in range(n_bins)]
    bin_width = 1.0 / n_bins
    for i in range(len(labels)):
        nth_bin = int(preds[i]/bin_width)
        if labels[i]==1:
            pos[nth_bin] += 1
        else:
            neg[nth_bin] += 1
    accumulated_neg = 0
    satisfied_pair = 0
    for i in range(n_bins):
        satisfied_pair += (pos[i]*accumulated_neg + pos[i]*neg[i]*0.5)
        accumulated_neg += neg[i]
    return satisfied_pair / total_case

y = [1,0,0,0,1,0,1,0,]
pred = [0.9, 0.8, 0.3, 0.1,0.4,0.9,0.6,0.7]
print(AUC(y, pred, n_bins=100))

作为机器学习中的经典评价准则，AUC的计算也作为面试笔试常考的算法题。

参考：
AUC详解与python实现

猜你喜欢

转载自www.cnblogs.com/hellojamest/p/11711876.html

Python计算AUC

AUC计算

AUC的计算

python 读取pmml文件计算auc

auc如何计算？附python 代码

AUC画图与计算

sql 计算auc

AUC计算方法

AUC的计算方法总结

AUC计算方法总结

使用SQL计算AUC值

Python实用的技能：利用Python画ROC曲线和AUC值计算

ROC和AUC介绍以及如何计算AUC

auc

AUC（计算方法）--ROC曲线

ROC曲线和AUC面积计算 matlab

详解ROC/AUC计算过程

机器学习：基于sklearn的AUC的计算原理

ROC 和 AUC的计算过程

多标签评价指标AUC计算

AUC的95%置信区间计算

AUC的两种计算方式

ROC曲线和AUC值的python代码

使用sklearn中roc曲线计算AUC值

对AUC计算公式和几何意义的理解

ROC，AUC，Precision，Recall，F1的介绍与计算

详解scikit-learn计算ROC/AUC曲线

模型评估:ROC曲线的绘制和AUC的计算

ROC和AUC计算， sklearn.metrics roc_curve、precision_recall_curve、auc、roc_auc_score，多标签分类ROC曲线绘制

机器学习评价指标 ROC与AUC 的理解和python实现

今日推荐

wlnmp 一键安装包更新 240522

ChatGPT 严重宕机，结果被造谣“遭遇俄罗斯黑客入侵”

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

周排行

010-题目：利用条件运算符的嵌套来完成此题：学习成绩>=90分的同学用A表示，60-89分之间的用B表示，60分以下的用C表示。

接口测试-工作心得记录八（使用locust库书写接口并发）

物理分页和逻辑分页

Hive建表语句详解--CREATE TABLE

爬虫学习----学习get和post请求

PDF生成类库

POJ 2139

前端路由基本原理

I/O多路转接之epoll

.NET开源项目 QuarkDoc 一款自带极简主义属性的文档管理系统

每日归档

更多

2024-05-23(9)

2024-05-22(41)

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)