sklearn的predict_proba - 代码天地

sklearn的predict_proba

其他 2018-06-06 20:12:19 阅读次数: 0

发现个很有用的方法——predict_proba

今天在做数据预测的时候用到了，感觉很不错，所以记录分享一下，以后可能会经常用到。

我的理解：predict_proba不同于predict，它返回的预测值为，获得所有结果的概率。（有多少个分类结果，每行就有多少个概率，以至于它对每个结果都有一个可能，如0、1就有两个概率）

举例：

获取数据及预测代码：

from sklearn.linear_model import LogisticRegression
import numpy as np

train_X = np.array(np.random.randint(0,10,size=30).reshape(10,3))
train_y = np.array(np.random.randint(0,2,size=10))
test_X = np.array(np.random.randint(0,10,size=12).reshape(4,3))

model = LogisticRegression()
model.fit(train_X,train_y)
test_y = model.predict_proba(test_X)

print(train_X)
print(train_y)
print(test_y)

训练数据

[[2 9 8]
 [0 8 5]
 [7 1 2]
 [8 4 6]
 [8 8 3]
 [7 2 7]
 [6 4 3]
 [1 4 4]
 [1 9 3]
 [3 4 7]]

训练结果，与训练数据一一对应：

[1 1 1 0 1 1 0 0 0 1]

测试数据：

[[4 3 0]        #测试数据
 [3 0 4]
 [2 9 5]
 [2 8 5]]

测试结果，与测试数据一一对应：

[[0.48753831 0.51246169]    
 [0.58182694 0.41817306]
 [0.85361393 0.14638607]
 [0.57018655 0.42981345]]

可以看出，有四行两列，每行对应一条预测数据，两列分别对应对于0、1的预测概率（左边概率大于0.5则为0，反之为1）

扫描二维码关注公众号，回复： 1498249 查看本文章

我们来看看使用predict方法获得的结果：

test_y = model.predict(test_X)
print(test_y)

输出结果：[1,0,0,0]

所以有的情况下predict_proba还是很有用的，它可以获得对每种可能结果的概率，使用predict则是直接获得唯一的预测结果，所以在使用的时候，应该灵活使用。

猜你喜欢

转载自blog.csdn.net/qq_36523839/article/details/80405455

sklearn的predict_proba

sklearn中predict_proba、predict用法

sklearn中predict_proba用法（注意和predict的区别）

sklearn中predict_proba的用法例子(转)

Sklearn-LogisticRegression逻辑回归以及sklearn中predict_proba用法（注意和predict的区别）

sklearn中的predict与predict_proba的区别（得到各条记录每个标签的概率（支持度））

sklearn.linear_model.LogisticRegression模型参数详解与predict、predict_proba源码解析

scikit-learn中predict_proba用法 (与predict的区别）

DecisionTreeClassifier的predict_proba(self,X)踩坑记

成功解决AttributeError: predict_proba is not available when probability=False

SVC的predict、decision_function和predict_proba结果说明

xgboost: predict 和 predict_proba 分类器正确率计算的讨论

sklearn学习：clf.predict_proba(X_train)[:, 1]是什么意思？

sklearn中调用某个机器学习模型model.predict(x)和model.predict_proba(x)的区别

web安全之机器学习入门——3.1 KNN/k近邻算法 web安全之机器学习入门——2.机器学习概述 scikit-learn K近邻法类库使用小结 predict predict_proba区别的小例子

Predict Referendum by sklearn package in python

Python sklearn中的.fit与.predict的作用

Keras之DNN：基于Keras(sigmoid+binary_crossentropy+predict_proba)利用DNN实现分类预测概率——DIY二分类数据集&预测新数据点

【sklearn】训练集和测试集维度不一致问题（svm调用predict出现ValueError: X.shape should be equal to或者Dimension mismatch等问题

sklearn

ｓｋｌｅａｒｎ

动态规划-Predict the Winner

线性模型的fit，predict

Predict the Winner 预测赢家

486. Predict the Winner

softMax(2)---predict实现

2、knn predict cancer

kaggle——predict futures sales

Predict（生成图像）

Keras中predict()方法和predict_classes()方法的区别

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)