部分UCI数据集分享 - 代码天地

部分UCI数据集分享

编程语言 2023-04-08 10:51:18 阅读次数: 0

UCI数据集官网链接 https://archive.ics.uci.edu/ml/datasets.php
下面是部分UCI数据集包括 “Breastcancer”,“BreastEW”,“Exactly”,“HeartEW”,“Hillvalley”,“Libras”,“LVST”,“Musk1”,“Parkinsons”,“Sonarall”,“Spectf”,“Tic-tac-toe”,“Vote”,“WDBC”,"Wine"等
数据集均为.csv格式其中第一列为样本属性。
百度网盘链接链接：https://pan.baidu.com/s/1kLXFKBFHGJpeNQWYDF7IFw
提取码：2mun
在这里插入图片描述

import pandas as pd
import numpy as np
def dataset_load(dataset):
    data = pd.read_csv(dataset,header = None)
    data = np.array(data)
    n, m = data.shape
    #数据预处理，将离散变量转变为数字量
    for one in range(m):
        col=data[:,one]
        #是数字类型
        if (str(list(col)[0]).split(".")[0]).isdigit() or str(list(col)[0]).isdigit() or ((str(list(col)[0]).split('-')[-1]).split(".")[-1].isdigit()and(str(list(col)[0]).split('-')[0]).isdigit()):
            data[:,one]=data[:,one]
        #是字符类型
        else:
            data[:,one]=pd.factorize(data[:,one])[0].astype(np.uint16)
    x = data[:,1:] #x为特征
    y = data[:,0]  #y为标签
    return x,y
if __name__=='__main__':
    dataset='Wine.csv' #这里注意将数据集和程序放在同一路径
    x,y=dataset_load(dataset)         #读入数据 
    print(x)

如有问题欢迎大家讨论。

猜你喜欢

转载自blog.csdn.net/weixin_51327281/article/details/124253575

部分UCI数据集分享

分享几组常用UCI数据

uci数据集汇总及翻译

UCI数据集整理（附论文常用数据集）

Matlab读取UCI数据集Iris中数据

UCI银行营销数据集---数据可视化

UCI数据集iris数据简单的可视化

机器学习数据集：UCI Maching Learning Reposirity 473

如何下载UCI数据集转成arff格式的文件

UCI银行营销数据集--缺失值处理方法

UCI——心脏病数据集分析报告

UCI German Credit 数据集完成logistic回归实战

UCI数据集详解及其数据处理（附148个数据集及处理代码）

UCI银行营销数据集--数据集不平衡

基于MLP完成CIFAR-10数据集和UCI wine数据集的分类

聚类算法之K-means算法－UCI数据集上的java实现

C4.5 决策树算法对UCI wine数据集分类的实现(MATLAB)

UCI库中Mines vs. Rocks的数据集属性可视化展示

DetNet数据集代码部分

目标检测数据集分享

Tiny ImageNet 数据集分享

UCI 人口收入数据分析（python）

开放公共数据集整理分享

UCI数据集数据的分析 ——葡萄酒数据

UCI数据集数据的分析（补充）——葡萄酒数据

介绍UCI机器学习数据库的Python API

UCI机器学习数据库的Python API介绍

R语言图形用户界面数据挖掘包Rattle：加载UCI糖尿病数据集、并启动Rattle图形用户界面、构建条件推理树模型、调用party包中的ctree函数构建条件推理树模型

2019数据库部分面试题经典集

机器学习数据集采样部分相关知识

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)