python划分训练集和测试集 - 代码天地

python划分训练集和测试集

其他 2018-07-26 22:09:52 阅读次数: 0

【第一种】方法

def splitData(data,seed,m,k)：
#将数据分成训练集和测试集，每次指定seed，更换K,重复M次,防止过拟合.
    test=[]
    train=[]
    #random.seed(seed),指定seed的话，每次后面的随机数产生的都是一样的顺序
    np.random.seed(seed)
    for user,item in data.items():
        #随机数产生顺序一样,随机产生（0，m）之间的数，只有一个可以分给测试集，另外的m-1都分给训练集
        if np.random.randint(0,m)==k:
            test.append([user,item])
        else:
            train.append([user,item])
    return test,train
test,train=splitData(data,5,7,5)
print(len(test))
print(len(train))

【结果】

【第二种划分数据集方式】

直接调用sklearn包，简直不要太方便，pip安装下载就好了，如果缺少scipy包，用pip再安装下载

完了，就直接调用train,test,train_label,test_lable=

train_test_split(ratings[['user_id','movies_id']],range(len(ratings)),test_size=7/8)

参数：数据集，数据集标签，test_size的值如果介于0-1之间就是划分比例，如果是整数就是样本数

返回值：训练集，训练集标签，测试集，测试集标签

def splitData(data,seed,m,k)：
#将数据分成训练集和测试集，每次指定seed，更换K,重复M次,防止过拟合.
    test=[]
    train=[]
    #random.seed(seed),指定seed的话，每次后面的随机数产生的都是一样的顺序
    np.random.seed(seed)
    for user,item in data.items():
        #随机数产生顺序一样,随机产生（0，m）之间的数，只有一个可以分给测试集，另外的m-1都分给训练集
        if np.random.randint(0,m)==k:
            test.append([user,item])
        else:
            train.append([user,item])
    return test,train
test,train=splitData(data,5,7,5)
print(len(test))
print(len(train))

猜你喜欢

转载自blog.csdn.net/brave_jcc/article/details/79582513

python划分训练集和测试集

训练集和测试集划分方法

随机划分训练集和测试集

python 机器学习划分训练集/测试集/验证集

训练集，测试集和验证集划分的意义

数据集的训练集和测试集划分

如何把数据集划分成训练集和测试集

【划分训练集、验证集和测试集(xml版本)】

将数据集划分为训练集和测试集

学习笔记：使用python将数据集划分成测试集和训练集

训练集、验证集、测试集的划分

python实现划分机器学习训练集与测试集

利用sklearn划分训练集和测试集

python按设定比例划分训练集和测试集代码

Python scikit-learn，数据集，获取自带数据集，数据集划分(划分为训练集和测试集)

Python分割训练集和测试集

机器学习：训练集与测试集的划分

python实现对于数据集的划分（随机划分出训练集和验证集）

Python将样本划分为训练集/验证集/测试集

用python程序按比例划分数据集(训练集+测试集)

【深度学习】使用python划分数据集为训练集和验证集和测试集并放在不同的文件夹(转载)

训练集、测试集和验证集(使用sklearn进行划分)

怎么为小数据集划分训练集和测试集

数据集划分为训练集和测试集并生成标签--matlab代码

训练集、验证集和测试集的概念及划分原则

YOLOv5目标检测（数据集格式转换并划分训练集和测试集）

【自存代码】划分数据集为训练集和测试集

训练集、验证集、测试集的作用及划分方法

关于训练集,验证集,测试集的划分

训练集，验证集，测试集关系及划分

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)