sklearn中的predict与predict_proba的区别（得到各条记录每个标签的概率（支持度）） - 代码天地

sklearn中的predict与predict_proba的区别（得到各条记录每个标签的概率（支持度））

其他 2018-07-30 17:56:58 阅读次数: 0

假定在一个k分类问题中，测试集中共有n个样本。则：

predict返回的是一个大小为n的一维数组，一维数组中的第i个值为模型预测第i个预测样本的标签；

predict_proba返回的是一个n行k列的数组，第i行第j列上的数值是模型预测第i个预测样本的标签为j的概率。此

时每一行的和应该等于1。

举个例子：

>>> from sklearn.linear_model import LogisticRegression

>>> import numpy as np

>>> x_train = np.array([[1,2,3],[1,3,4],[2,1,2],[4,5,6],[3,5,3],[1,7,2]])

>>> y_train = np.array([0, 0, 0, 1, 1, 1])

>>> x_test = np.array([[2,2,2],[3,2,6],[1,7,4]])

>>> clf = LogisticRegression()

>>> clf.fit(x_train, y_train)

# 返回预测标签

>>> clf.predict(x_test)

array([1, 0, 1])

# 返回预测属于某标签的概率

>>> clf.predict_proba(x_test)

array([[ 0.43348191, 0.56651809],[ 0.84401838, 0.15598162],[ 0.13147498, 0.86852502]])

预测[2,2,2]的标签是0的概率为0.43348191，1的概率为0.56651809

预测[3,2,6]的标签是0的概率为0.84401838，1的概率为0.15598162

预测[1,7,4]的标签是0的概率为0.13147498，1的概率为0.86852502

所以，若希望预测结果直接是某预测标签，则用predict

若希望预测结果是标签的概率则用predict_proba

猜你喜欢

转载自www.cnblogs.com/caiyishuai/p/9391787.html

sklearn中的predict与predict_proba的区别（得到各条记录每个标签的概率（支持度））

sklearn中predict_proba用法（注意和predict的区别）

sklearn中predict_proba、predict用法

sklearn的predict_proba

Sklearn-LogisticRegression逻辑回归以及sklearn中predict_proba用法（注意和predict的区别）

scikit-learn中predict_proba用法 (与predict的区别）

sklearn中predict_proba的用法例子(转)

sklearn.linear_model.LogisticRegression模型参数详解与predict、predict_proba源码解析

sklearn中调用某个机器学习模型model.predict(x)和model.predict_proba(x)的区别

DecisionTreeClassifier的predict_proba(self,X)踩坑记

成功解决AttributeError: predict_proba is not available when probability=False

SVC的predict、decision_function和predict_proba结果说明

xgboost: predict 和 predict_proba 分类器正确率计算的讨论

web安全之机器学习入门——3.1 KNN/k近邻算法 web安全之机器学习入门——2.机器学习概述 scikit-learn K近邻法类库使用小结 predict predict_proba区别的小例子

Python sklearn中的.fit与.predict的作用

Keras中predict()方法和predict_classes()方法的区别

sklearn学习：clf.predict_proba(X_train)[:, 1]是什么意思？

Predict Referendum by sklearn package in python

keras中model.evaluate 和 model.predict的区别

Keras中predict()方法和predict_classes()方法

arima中predict中params怎么使用

Keras之DNN：基于Keras(sigmoid+binary_crossentropy+predict_proba)利用DNN实现分类预测概率——DIY二分类数据集&预测新数据点

model.evaluate 和 model.predict 的区别

动态规划-Predict the Winner

线性模型的fit，predict

Predict the Winner 预测赢家

486. Predict the Winner

softMax(2)---predict实现

2、knn predict cancer

kaggle——predict futures sales

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)