SKLearn的Random Forest的最简单例子（csv数据文件） - 代码天地

SKLearn的Random Forest的最简单例子（csv数据文件）

其他 2018-05-25 14:42:55 阅读次数: 0

其实网上这方面的教程已经很多了，例如这里：https://blog.csdn.net/CherDW/article/details/54971771 就讲得很不错，不过往往大家的例子都比较复杂，我这里仅仅举一个最简单的例子，帮助大家快速测试结果：

import pandas as pd
from sklearn.ensemble import RandomForestClassifier
from sklearn import metrics

#导入训练数据，这里的训练数据使用Under-Sampling处理过的
train= pd.read_csv('train-balance.csv')
target='bug'
IDcol='name'
print train['bug'].value_counts()

#去掉ID和属性列
x_columns = [x for x in train.columns if x not in [target,IDcol]]
X = train[x_columns]
y = train['bug']

#训练Random Forest
rf0 = RandomForestClassifier(oob_score=True, random_state=10)
rf0.fit(X,y)
print rf0.oob_score_

#导入测试数据，和训练数据一样的处理方法
test=pd.read_csv('test.csv')
x_test_columns = [x for x in test.columns if x not in [target,IDcol]]
X_test=test[x_test_columns]
y_test=test['bug']

#输出在测试数据上的AUC值
y_predprob = rf0.predict_proba(X_test)[:,1]
print "AUC Score (Test): %f" % metrics.roc_auc_score(y_test,y_predprob)

就简单记录这么多。

猜你喜欢

转载自blog.csdn.net/qysh123/article/details/79728679

SKLearn的Random Forest的最简单例子（csv数据文件）

sklearn中的random_forest

Random Forest（sklearn参数详解)

使用sklearn--Random Forest参数说明，随机森林调参数

sklearn中的random_state

sklearn.random_projection讲的较详细

随机森林（Random Forest）简单介绍

Bagging and Random Forest

随机森林（Random Forest）

随机森林 Random Forest

Bagging，Boosting，Random Forest

random_forest

Random Forest And Extra Trees

sklearn的train_test_split的random_state

sklearn的train_test_split函数的random_state

【ML】随机森林（Random Forest）

Bootstrap,Bagging and Random Forest Algorithm

Out of bag error in Random Forest

Random Forest面试要点总结

MachineLearning—Random Forest实现 python

MachineLearning—随机森林(Random Forest)

随机森林（Random Forest， RF）

0601-random_forest_demo

随机森林Random Forest （RF）

使用sklearn.MLPClassifier的简单例子

基于数据流的异常检测：Robust Random Cut Forest

缺失数据填补基础方法（2）——Random Forest (MissForest)填补

最简单的机器学习流程基于sklearn

Python最简单的sklearn库安装教程

【sklearn】数据预处理 sklearn.preprocessing

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)