李航《统计学习方法》——第八章提升方法 - 代码天地

李航《统计学习方法》——第八章提升方法

其他 2018-06-12 05:18:12 阅读次数: 0

提升方法就是组合一系列弱分类器构成一个强分类器，AdaBoost是其代表性算法

AdaBoost算法

适用问题：二类分类，要处理多类分类需进行改进

代码(用sklearn实现)：

# encoding=utf-8

import pandas as pd
import time

from sklearn.cross_validation import train_test_split
from sklearn.metrics import accuracy_score

from sklearn.ensemble import AdaBoostClassifier

if __name__ == '__main__':

    print("Start read data...")
    time_1 = time.time()

    raw_data = pd.read_csv('../data/train_binary.csv', header=0) 
    data = raw_data.values

    features = data[::, 1::]
    labels = data[::, 0]

    # 随机选取33%数据作为测试集，剩余为训练集
    train_features, test_features, train_labels, test_labels = train_test_split(features, labels, test_size=0.33, random_state=0)

    time_2 = time.time()
    print('read data cost %f seconds' % (time_2 - time_1))


    print('Start training...') 
    # n_estimators表示要组合的弱分类器个数；
    # algorithm可选{‘SAMME’, ‘SAMME.R’}，默认为‘SAMME.R’，表示使用的是real boosting算法，‘SAMME’表示使用的是discrete boosting算法
    clf = AdaBoostClassifier(n_estimators=100,algorithm='SAMME.R')
    clf.fit(train_features,train_labels)
    time_3 = time.time()
    print('training cost %f seconds' % (time_3 - time_2))


    print('Start predicting...')
    test_predict = clf.predict(test_features)
    time_4 = time.time()
    print('predicting cost %f seconds' % (time_4 - time_3))


    score = accuracy_score(test_labels, test_predict)
print("The accruacy score is %f" % score)

代码可从这里AdaBoost/AdaBoost_sklearn.py获取

实验数据为train.csv的运行结果：

实验数据为train_binary.csv的运行结果：

猜你喜欢

转载自blog.csdn.net/fuqiuai/article/details/79507206

李航《统计学习方法》——第八章提升方法

李航《统计学习方法》——第八章Boosting提升方法【补充集成学习】+习题答案

李航《统计学习方法》——第八章Boosting提升方法【补充集成学习】+习题答案

《统计学习方法》第八章: 提升方法读书笔记

《统计学习方法》第八章，提升方法

《统计学习方法》第八章提升方法

李航《统计学习方法》第八章——用Python+Cpp实现AdaBoost算法（MNIST数据集）

《统计学习方法》学习笔记（第八章）

统计学习方法　李航　提升方法

【统计学习方法-李航-笔记总结】八、提升方法

统计学习方法-李航（第8章提升方法笔记)

统计学习方法 - 李航

学习笔记_第一章统计学习方法概率-《统计学习方法》李航

【统计学习方法by李航】第一章统计学习方法概论个人总结

统计学习方法-李航-第一章：统计学习方法概论-笔记1

李航·《统计学习方法》学习笔记

《统计学习方法》（李航）——学习笔记

《统计学习方法（李航）》统计学习方法概论学习笔记

李航《统计学习方法》习题8.1

李航《统计学习方法》_笔记总结

李航统计学习方法课后习题答案

李航《统计学习方法》---感知机

李航《统计学习方法》-----支持向量机

李航《统计学习方法》笔记

李航《统计学习方法》CH02

李航《统计学习方法》CH03

李航《统计学习方法》系列Python实现

李航统计学习方法查缺补漏

统计学习方法_李航_笔记

统计学习方法（李航）笔记

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)