AI（一）sklearn数据集 - 代码天地

AI（一）sklearn数据集

其他 2018-10-22 17:27:09 阅读次数: 0

官方文档 sklearn.datasets: Datasets

sklearn中包含了很多可以用于机器学习算法的示例数据集

# sklearn数据集的使用
from sklearn.datasets import load_iris

# 加载鸢尾花数据集
iris = load_iris()

# 鸢尾花数据集包含150组数据
# 每组数据由4个变量和1个目标值构成
data = iris.data
target = iris.target

# 数据类型都为numpy.ndarray
# data是样本数×数据维数的数组
# target是data对应的目标值数组
data.shape, target.shape
# ((150, 4), (150,))

sklearn中也包含了生成指定样式随机数据的函数

# sklearn生成器的使用
from sklearn.datasets import make_circles

# make_circle函数可以生成形似两个同心圆的数据
# x是二维数组，第一维是样本索引，第二维是横纵坐标
# y是一维数组，标记x是在内圈还是在外圈
# n_samples表示样本数
# shuffle表示是否打乱数据
# noise表示高斯噪声的标准偏差
# factor表示内外圆半径比例
x, y = make_circles(n_samples=2000, shuffle=True, noise=0.1, factor=0.5)

# 将数据可视化
import matplotlib.pyplot as plt
plt.plot(x[:, 0], x[:, 1], '.')

sklearn还可以进行数据分割，将原始数据分割为训练集和测试集

# 返回参数依次为训练数据集、测试数据集、训练目标集、测试目标集
# x, y表示原始数据集
# test_size表示训练集的比例
# shuffle表示是否打乱数据
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.3, shuffle=True)
X_train.shape, X_test.shape, y_train.shape, y_test.shape
# ((1400, 2), (600, 2), (1400,), (600,))

猜你喜欢

转载自blog.csdn.net/lolimostlovely/article/details/83004400

AI（一）sklearn数据集

sklearn提供的数据集

sklearn数据集

sklearn数据集划分

sklearn自带数据集

sklearn datasets数据集

Sklearn——数据集分割

【DA】sklearn的数据集

sklearn的快速使用之一（数据集探索）

sklearn-数据集划分

sklearn中数据集划分

sklearn 划分数据集

机器学习 sklearn 数据集

Sklearn数据集与机器学习

sklearn提供的自带数据集

sklearn----数据集操作

Sklearn提供的常用数据集

sklearn的数据集模块datasets

ai专用，数据集

AI 数据集资源

AI数据集

【AI】数据集汇总

AI-sklearn 学习笔记（一）

机器学习之sklearn数据集

（转载）基于sklearn的iris数据集及简介

Python——sklearn提供的自带的数据集

sklearn中对于数据集大小的界定 *

numpy数据集练习 ----------sklearn类

Python Sklearn数据集划分函数StratifiedShuffleSplit

Sklearn 读取 minist 数据集问题

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)