机器学习/深度学习常用数据集归纳（附百度网盘链接）

其他 2020-03-11 23:21:32 阅读次数: 0

文章目录

一、前言
二、分类常用数据集

（1）海伦约会
（2）iris鸢尾花数据集
（3）垃圾邮件过滤
（4）cifar10/100数据集
（6）mnist数据集

三、聚类常用数据集

（1）Kmean-dataset

四、回归常用数据集

（1）Boston房屋价格预测

五、分割常用数据集

（1）视网膜血管

一、前言

数据集不定时更新，欢迎大家分享更多的数据集，若数据集分享链接失效的话，可评论或私聊博主，还有…emmmm, 制造不易，点个赞再走把！！
最后一次更新日期：2020.3.7

二、分类常用数据集

（1）海伦约会

样本数据特征： 1.每年获得的飞行常客里程数
2.玩视频游戏所消耗事件百分比
3.每周消费的冰激凌公升数

样本标签值： 1.不喜欢的人
2.魅力一般的人
3.极具魅力的人

数据集格式： txt文件

百度网盘链接：海伦约会数据集
提取码：xgm6

（2）iris鸢尾花数据集

样本数据特征： 1.Sepal.Length（花萼长度）
2.Sepal.Width（花萼宽度）
3.Petal.Length（花瓣长度）
4.Petal.Width（花瓣宽度）

样本标签值： 1.setosa
2.versicolor
3.virginica

数据集格式： csv文件

百度网盘链接：iris鸢尾花数据集
提取码：5m0q

（3）垃圾邮件过滤

数据集说明： 数据集下包含两个文件夹，其中spam文件夹下为垃圾邮件，ham文件夹下为非垃圾邮件。

数据集格式： txt文件

百度网盘链接：垃圾邮件过滤
提取码：3pny

（4）cifar10/100数据集

cifar10数据集说明：由10个类的60000个32x32彩色图像组成，每个类有6000个图像。有50000个训练图像和10000个测试图像。数据集分为五个训练批次和一个测试批次，每个批次有10000个图像。测试批次包含来自每个类别的恰好1000个随机选择的图像。

数据集类型：python版本

说明：其中readme.html文件下包含Matlab和binary两个版本的下载，以及包含cifar100的下载链接，需要者可自行下载。

百度网盘链接：cifar10/100数据集下载
提取码：diwr

（6）mnist数据集

cifar10数据集说明：MNIST数据集由60000个训练样本和10000个测试样本组成，每个样本都是一张28 * 28像素的灰度手写数字图片。

数据集格式：.pkl文件、.txt文件（binary）、.rar文件（image）

百度网盘链接：pkl格式mnist数据集
提取码：cd5i

百度网盘链接：txt格式mnist数据集
提取码：an60

百度网盘链接：rar格式mnist数据集
提取码：4ehe

三、聚类常用数据集

（1）Kmean-dataset

说明：此数据集为编写Kmeans算法时，创造的简易数据集，包含四个特征值，有需要的朋友可以自取。

数据集格式： txt文件

百度网盘链接：Kmeans算法数据集
提取码：891h

四、回归常用数据集

（1）Boston房屋价格预测

样本数据特征： 1.CRIM：城镇人均犯罪率
2.ZN：住宅用地超过 25000
sq.ft. 的比例
3.CHAS：查理斯河空变量（如果
边界是河流，则为1；否则为0）
4.NOX：一氧化氮浓度
5.RM：住宅平均房间数
6.AGE：1940 年之前建成的自用
房屋比例
7.DIS：到波士顿五个中心区域的
加权距离
8.RAD：辐射性公路的接近指数
9.TAX：每 10000 美元的全值财
产税率
10.PTRATIO：城镇师生比例
11.B：1000（Bk-0.63）^ 2，其
中 Bk 指代城镇中黑人的比例
12.LSTAT：人口中地位低下者的
比例

样本target： MEDV：自住房的平均房价，以
千美元计

数据集格式： txt文件

百度网盘链接：Boston房屋价格预测数据集
提取码：svet

五、分割常用数据集

（1）视网膜血管

训练集： 共二十张图片（含标记）

测试集： 共二十张图片（含标记）

训练集具体说明： 视网膜血管数据集说明

数据集格式： 图片文件

百度网盘链接：DRIVE视网膜血管数据集
提取码：nz6p

Mingw_

发布了32 篇原创文章 · 获赞 62 · 访问量 1333

私信关注

猜你喜欢

转载自blog.csdn.net/Mingw_/article/details/104677127

机器学习/深度学习常用数据集归纳（附百度网盘链接）

【数据集】PASCAL VOC2012数据集百度网盘链接

CICIDS2017数据集（百度网盘链接）

Human3.6M dataset数据集百度网盘下载链接

SLAM数据集（百度网盘）

最新waymo数据集百度网盘

threeJs学习随笔（一），附百度网盘下载地址

python学习资料百度网盘分享

Tensorflow 实战Google深度学习框架(完整版) 百度网盘

《深度学习》高清PDF 百度网盘下载分享

《深度学习》高清PDF 百度网盘下载分享

《深度学习入门之Pytorch》高清PDF 百度网盘下载分享

python机器学习视频教程百度网盘下载？

《机器学习实战》高清PDF 百度网盘下载分享

手写数字识别MNIST数据集下载百度网盘链接快速下载

Linux下的编辑软件Remarkable安装与使用（附百度网盘下载链接）

Windows安装MySQL8.0.19 附百度网盘链接

RoboWare Studio安装教程（附百度网盘链接）

全网首发 nuScenes数据集（百度网盘 + 迅雷网盘） + 下载方法

人工智能，深度学习，计算机视觉，自然语言处理，机器学习，百度网盘视频教程

百度网盘获取下载链接

获取百度网盘真实链接

opencv下载百度网盘链接及安装

mnist数据集下载——mnist数据集提供百度网盘下载地址

常用字体包（百度网盘链接在文末）

《Spring源码深度解析》百度网盘

《深度学习之TensorFlow：入门、原理与进阶实战》高清PDF百度网盘下载分享

《Tensorflow 实战Google深度学习框架》高清版PDF 百度网盘下载分享

《深度学习之TensorFlow：入门、原理与进阶实战》高清PDF 百度网盘下载分享

《深度学习：原理与应用实践.张重生(详细书签)》高清PDF 百度网盘下载分享

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)