作业：利用AdaBoost对马疝病数据集（horseColic）进行分类预测 - 代码天地

作业：利用AdaBoost对马疝病数据集（horseColic）进行分类预测

其他 2020-08-03 13:40:29 阅读次数: 0

数据集
提取码：krry

先利用pandas读入csv文件，以DataFrame形式存储；然后将数据转成list（其实也可以直接操作，不过本人习惯这样做）：
data = np.array(data).tolist()
分割数据，最后一列作为标签类别y，其余列为x：

x = []; y = []
for i in range(len(data)):
     y.append(data[i][-1])
     del data[i][-1]
     x.append(data[i])

训练模型

clf = AdaBoostClassifier(base_estimator=DecisionTreeClassifier(max_depth=7, min_samples_leaf=7), n_estimators=100, algorithm='SAMME', learning_rate=0.95)
clf.fit(train_x, train_y)

测试

print(clf.score(test_x, test_y))

完整代码：

from sklearn.ensemble import AdaBoostClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.model_selection import cross_val_score
import pandas as pd
import numpy as np

def load_data(path):
    data = pd.read_csv(path, sep='\t', names=[i for i in range(22)])
    data = np.array(data).tolist()
    x = []; y = []
    for i in range(len(data)):
        y.append(data[i][-1])
        del data[i][-1]
        x.append(data[i])

    x = np.array(x)
    y = np.array(y)

    return x, y

def AdaBoost():
    train_x, train_y = load_data('ensemble/horseColicTraining.txt')
    test_x, test_y = load_data('ensemble/horseColicTest.txt')
    #训练
    clf = AdaBoostClassifier(base_estimator=DecisionTreeClassifier(max_depth=7, min_samples_leaf=7), n_estimators=100, algorithm='SAMME', learning_rate=0.95)
    clf.fit(train_x, train_y)
    #测试
    print(clf.score(test_x, test_y))


if __name__ == '__main__':
    AdaBoost()

猜你喜欢

转载自blog.csdn.net/Cyril_KI/article/details/107659768

作业：利用AdaBoost对马疝病数据集（horseColic）进行分类预测

基于梯度下降的逻辑回归（Logistics Regression）实现对马疝病数据集（horseColic）的分类预测

手写SVM（SMO）实现对马疝病数据集的分类

【机器学习笔记3】用逻辑回归预测马疝病的死亡率

机器学习实战--Logistic回归与实例：从疝病症预测病马的死亡率

对结构化数据进行分类（心脏病预测）

作业：利用XGBoost实现对鸢尾花数据集（Iris.csv）的分类预测

DataScience&ML：基于心脏病分类预测数据集利用等算法实现模型可解释性之详细攻略

机器学习：基于心脏病数据集的XGBoost分类预测

使用投票回归器VotingRegressor对糖尿病数据集进行回归预测

数据分析实战：利用python对心脏病数据集进行分析

利用keras自带房价数据集进行房价预测

项目：利用adaboost对Employee满意度进行分类

机器学习实战——利用Logistic回归预测疝气病症的病马的死亡率

基于双月数据集利用感知层进行分类

随机森林实现回归预测(糖尿病数据集)

基于逻辑回归的病马死亡预测

ML之NB：利用朴素贝叶斯NB算法(CountVectorizer+不去除停用词)对20类新闻文本数据集进行分类预测

分类预测 | Matlab实现基于BP-Adaboost数据分类预测

数据分析训练-Pima印第安人数据集上的机器学习-分类算法（根据诊断措施预测糖尿病的发病）

鸢尾花数据集分类-AdaBoost\XGBoost

机器学习进行数据分类模型的预测（含代码及数据集）

Tensorflow学习教程------利用卷积神经网络对mnist数据集进行分类_利用训练好的模型进行分类

机器学习（二）——xgboost（实战篇）Pima印第安人数据集上的机器学习-分类算法（根据诊断措施预测糖尿病的发病）

LR/SVM/DT/AdaBoost/NB 糖尿病预测（2）

使用AdaBoost算法来对视频数据进行分类

【源码】利用多类支持向量机分类器进行植物叶病检测与分类

机器学习糖尿病预测模型-美国疾控中心CDC25万数据集，生物医药企业科研_论文作业_专利

人工智能糖尿病预测模型-美国疾控中心CDC25万数据集，生物医药企业科研_论文作业_专利

使用sklearn中的Iris植物分类数据集进行特征检验与预测分析

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)