机器学习 sklearn 数据集 - 代码天地

机器学习 sklearn 数据集

编程语言 2019-01-04 09:50:51 阅读次数: 0

sklearn.datasets

（1）datasets.load_*()

获取小规模数据集，数据包含在datasets里

1）鸢尾花数据集

from sklearn.datasets import load_iris

def iris_set():
    """
    鸢尾花卉数据集
    花萼 花瓣：长，宽
    :return: None
    """
    li = load_iris()

    print("获取特征值")
    print(li.data)
    print("目标值")
    print(li.target)
    print(li.DESCR)

    #特征值，目标值  根据一系列的特征来预测目标，例如：户型，学区，收入来预测房价。
    #注意返回值, 训练集 train  x_train, y_train        测试集  test   x_test, y_test
    x_train, x_test, y_train, y_test = train_test_split(li.data, li.target, test_size=0.25)

    print("训练集特征值和目标值：", x_train, "\n", y_train, "\n")
    print("测试集特征值和目标值：", x_test, y_test)

    return None

2）20个不同主题的新闻数据集


from sklearn.datasets import fetch_20newsgroups

def boston_set():

    """
    房屋特征-房价
    :return:None
    """
    lb = load_boston()

    print("获取特征值")
    print(lb.data)
    print("目标值")
    print(lb.target)
    print(lb.DESCR)

    return  None

3）波士顿房价数据集

from sklearn.datasets import load_boston

def boston_set():

    """
    房屋特征-房价
    :return:None
    """
    lb = load_boston()

    print("获取特征值")
    print(lb.data)
    print("目标值")
    print(lb.target)
    print(lb.DESCR)

    return  None

（2）datasets.fetch_*()

获取大规模数据集，需要从网络上下载，函数的第一个参数是data_home，表示数据集下载的目录，默认是 ~/scikit_learn_data/，要修改默认目录，可以修改环境变量SCIKIT_LEARN_DATA。

猜你喜欢

转载自blog.csdn.net/Rand_C/article/details/85757581

机器学习 sklearn 数据集

Sklearn数据集与机器学习

机器学习之sklearn数据集

机器学习笔记(四)--sklearn数据集

sklearn数据集与机器学习组成

机器学习（3）——机器学习组成与sklearn数据集操作

机器学习sklearn iris数据集官方demo

机器学习实践（二）—sklearn之数据集

机器学习sklearn之knn拟合iris数据集的实现

机器学习sklearn之数据集划分+KNN算法

Machine Learning | (2) sklearn数据集与机器学习组成

机器学习sklearn库安装与分类、回归数据集

【学习笔记】sklearn数据集与估计器

【机器学习】sklearn数据集的使用，数据集的获取和划分

机器学习sklearn—数据的特征预处理

机器学习 sklearn 数据的特征抽取

使用sklearn进行机器学习，数据挖掘

[机器学习 03] 数据预处理-sklearn

sklearn机器学习包中的对原始数据的预处理及训练集、测试集的分割

初识人工智能(二):机器学习(三):sklearn数据集

python机器学习之门之sklearn的使用（使用鸢尾花数据集）

【机器学习笔记day07】2. sklearn数据集与机器学习组成+机器学习组成：模型、策略、优化+ 开发机器学习应用程序的步骤

sklearn提供的数据集

sklearn数据集

sklearn数据集划分

sklearn自带数据集

sklearn datasets数据集

Sklearn——数据集分割

【DA】sklearn的数据集

sklearn学习-3-样本数据集

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)