机器学习笔记(四)--sklearn数据集

其他 2019-03-24 17:11:26 阅读次数: 0

sklearn数据集

（一）机器学习的一般数据集会划分为两个部分

训练数据：用于训练，构建模型。

测试数据：在模型检验时使用，用于评估模型是否有效。

划分数据的API:sklearn.model_selection.train_test_split

示例代码如下：

from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split


# 使用加载器读取数据并存入变量iris
iris = load_iris()
# 查验数据规模
print(iris.data.shape)
# 用于输入的数据
#print(iris.data)
# 标签
#print(iris.target)
# 对数据进行随机分割 测试数据占总数据的30% 训练数据占总数据的70%
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.3, random_state=30)
print('训练特征值：')
print(x_train)
print('训练目标值：')
print(y_train)
print('测试特征值：')
print(x_test)
print('测试目标值：')
print(y_test)

(二)转换器

fit_transform等价于 fit+transform

fit_transform()函数输入数据直接转换。

fit()函数输入数据，但不做事。计算平均值，方差等

transform()函数进行数据的转换。

(三)估计器

在sklearn中，估计器（estimator）是一类实现了算法的API。

1.用于分类的估计器：

sklearn.neighbors k-近邻算法

sklearn.naive_bayes 贝叶斯

sklearn.linear_model.LogisticRegression 逻辑回归

sklearn.tree 决策树与随机森林

2.用于回归的估计器

sklearn.linear_model.LinearRegression 线性回归

sklearn.linear_model.Ridge 岭回归

猜你喜欢

转载自www.cnblogs.com/doctorXiong/p/10588809.html

机器学习笔记(四)--sklearn数据集

机器学习 sklearn 数据集

Sklearn数据集与机器学习

机器学习之sklearn数据集

sklearn数据集与机器学习组成

机器学习（3）——机器学习组成与sklearn数据集操作

【学习笔记】sklearn数据集与估计器

【机器学习】sklearn 笔记

【机器学习笔记day07】2. sklearn数据集与机器学习组成+机器学习组成：模型、策略、优化+ 开发机器学习应用程序的步骤

机器学习sklearn iris数据集官方demo

机器学习实践（二）—sklearn之数据集

机器学习sklearn之knn拟合iris数据集的实现

机器学习sklearn之数据集划分+KNN算法

Machine Learning | (2) sklearn数据集与机器学习组成

机器学习sklearn库安装与分类、回归数据集

【机器学习】sklearn数据集的使用，数据集的获取和划分

sklearn机器学习包中的对原始数据的预处理及训练集、测试集的分割

机器学习笔记——数据集分割

机器学习笔记之数据集

机器学习笔记 - 探索 keras 数据集

天池赛学习笔记——使用sklearn+机器学习进行分类/回归任务之(二)数据集划分、预处理和特征工程

【机器学习笔记day08】2.1. Scikit-learn数据集+sklearn.datasets+ 获取小数据集+ 获取大数据集 +获取本地生成数据

Python机器学习笔记：sklearn库的学习

机器学习——Sklearn学习笔记——总章

04_机器学习概述，什么是机器学习，应用场景，数据来源与类型，网上可用的数据集、常用数据集数据的结构组成、特征工程是什么、意义、特征抽取、sklearn特征抽取API、文本特征抽取（学习笔记）

基于python3.7 numpy scipy matplotlib sklearn的机器学习笔记7--基于神经网络的手写数字识别(DBRHD数据集)

初识人工智能(二):机器学习(三):sklearn数据集

python机器学习之门之sklearn的使用（使用鸢尾花数据集）

实用机器学习笔记（四）：数据清洗

机器学习sklearn实战笔记(三)

今日推荐

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

周排行

Family Tree 题解

BZOJ 1093 最大半连通子图 SCC + DP

幂等处理

Spring----学习（2）----XML 配置Bean 自动装配

SQL Server 远程更新目标表数据

HIbernate3.6 环境搭建

特殊符号正则表达式

【Linux】第一章进程的理解

843. n-皇后问题（dfs+输出各种情况）

空间数据库2

每日归档

更多

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)