各种深度学习机器学习数据集(大多数内附读取脚本!)(建议按ctrl+F查询是否有需要的,持续更新中。。)

欢迎关注,高强度更新和MATLAB,PYTHON编程,C++编程,算法编程,深度学习,自然语言处理,图像处理,OPENCV等相关知识:)

摘要

MNIST数据集、行人车辆检测数据集、安全头盔数据集、白酒数据集、成人数据集、

各种深度学习机器学习数据集(大多数内附读取脚本!)(建议按ctrl+F查询是否有需要的,持续更新中。。)

行人检测数据集

下载链接

行人车辆检测数据集一共4500张验证集500张,我使用yolov5检测,map能高达98%!效果显著。

部分图片展示:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-pkaX22sK-1680932430493)(G:\csdnCODE\数据集存放\说明.assets\image-20230408122639679-16809280009802.png)]

ChineseMNIST数据集

下载链接

部分图片展示:图片大小为64*64,一共15W张。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-gbILJwuE-1680932338199)(G:\csdnCODE\数据集存放\说明.assets\image-20230408122542606-16809279447811.png)]

MNIST数据集(解压包中有加载的代码及数据集!)

下载链接

原始的MNIST数据集,如果是matlab读取的话,可以使用一下代码:

建立一个loadMNISTLabels.m脚本读取标签:

function labels = loadMNISTLabels(filename)
%loadMNISTLabels returns a [number of MNIST images]x1 matrix containing
%the labels for the MNIST images

fp = fopen(filename, 'rb');
assert(fp ~= -1, ['Could not open ', filename, '']);

magic = fread(fp, 1, 'int32', 0, 'ieee-be');
assert(magic == 2049, ['Bad magic number in ', filename, '']);

numLabels = fread(fp, 1, 'int32', 0, 'ieee-be');

labels = fread(fp, inf, 'unsigned char');

assert(size(labels,1) == numLabels, 'Mismatch in label count');

fclose(fp);

end

建立一个loadMNISTImages.m脚本读取图片:

function images = loadMNISTImages(filename)
%loadMNISTImages returns a 28x28x[number of MNIST images] matrix containing
%the raw MNIST images

fp = fopen(filename, 'rb');
assert(fp ~= -1, ['Could not open ', filename, '']);

magic = fread(fp, 1, 'int32', 0, 'ieee-be');
assert(magic == 2051, ['Bad magic number in ', filename, '']);

numImages = fread(fp, 1, 'int32', 0, 'ieee-be');
numRows = fread(fp, 1, 'int32', 0, 'ieee-be');
numCols = fread(fp, 1, 'int32', 0, 'ieee-be');

images = fread(fp, inf, 'unsigned char');
images = reshape(images, numCols, numRows, numImages);
images = permute(images,[2 1 3]);

fclose(fp);

% Reshape to #pixels x #examples
images = reshape(images, size(images, 1) * size(images, 2), size(images, 3));
% Convert to double and rescale to [0,1]
images = double(images) / 255;

end

Adult数据集

下载链接

​ 该数据从美国1994年人口普查数据库中抽取而来,因此也称作“人口普查收入”数据集,共包含48842条记录,年收入大于50k的占比76.07%,数据集已经划分为训练数据32561条和测试数据16281条。该数据集类变量为年收入是否超过50k

解压文件夹内包含一个读取数据集的py脚本文件,0基础小白轻松上手使用!
在这里插入图片描述

在这里插入图片描述

白酒质量数据集

下载链接

著名的机器学习数据集,解压包中含有该数据集以及一个.py脚本,运行该脚本可以直接把数据集加载到python中去0基础小白轻松上手使用!

在这里插入图片描述

garbage_classify_et.zip(垃圾分类数据集在zip文件中包含一个训练的脚本,可直接使用!)

下载链接

数据集说明一共4大类,40小类,在zip文件中包含一个训练的脚本,可直接使用!一共4000多个数据:

部分图片:

在这里插入图片描述

{
"0": "其他垃圾/一次性快餐盒",
"1": "其他垃圾/污损塑料",
"2": "其他垃圾/烟蒂",
"3": "其他垃圾/牙签",
"4": "其他垃圾/破碎花盆及碟碗",
"5": "其他垃圾/竹筷",
"6": "厨余垃圾/剩饭剩菜",
"7": "厨余垃圾/大骨头",
"8": "厨余垃圾/水果果皮",
"9": "厨余垃圾/水果果肉",
"10": "厨余垃圾/茶叶渣",
"11": "厨余垃圾/菜叶菜根",
"12": "厨余垃圾/蛋壳",
"13": "厨余垃圾/鱼骨",
"14": "可回收物/充电宝",
"15": "可回收物/包",
"16": "可回收物/化妆品瓶",
"17": "可回收物/塑料玩具",
"18": "可回收物/塑料碗盆",
"19": "可回收物/塑料衣架",
"20": "可回收物/快递纸袋",
"21": "可回收物/插头电线",
"22": "可回收物/旧衣服",
"23": "可回收物/易拉罐",
"24": "可回收物/枕头",
"25": "可回收物/毛绒玩具",
"26": "可回收物/洗发水瓶",
"27": "可回收物/玻璃杯",
"28": "可回收物/皮鞋",
"29": "可回收物/砧板",
"30": "可回收物/纸板箱",
"31": "可回收物/调料瓶",
"32": "可回收物/酒瓶",
"33": "可回收物/金属食品罐",
"34": "可回收物/锅",
"35": "可回收物/食用油桶",
"36": "可回收物/饮料瓶",
"37": "有害垃圾/干电池",
"38": "有害垃圾/软膏",
"39": "有害垃圾/过期药物"
}  

安全盔安全衣数据集(一步到位,适合小白!)

下载链接

1083张反光衣的数据集,数据集文件包含jpg图片和xml文件,数据集主要四类标注:带头盔的人、没带头盔的人、穿反光衣的人、未穿反光衣的人,主要标注反光衣,识别效果能达到百分之98以上,同时里面还有训练好的yolov5的权重数据,达98%!直接使用load命令即可,一步到位

解压包内容如下:

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-DMUSY2kU-1680932338201)(G:\csdnCODE\数据集存放\说明.assets\image-20230408131450904-16809308923624.png)]

猜你喜欢

转载自blog.csdn.net/qq_33950926/article/details/130027953
今日推荐