定义:
train_test_split(*arrays,
test_size=0.25,
train_size=None,
random_state=None,
shuffle=True,
statify=None)
返回:列表
参数:
- *arrays:数据集。
- test_size:如果为float,表示测试数据占比。如果为int,表示测试数据数量。如果为None,跟随train_size。默认为0.25。
- train_size:训练数据数量,同test_size。默认跟随test_size。
- random_state:随机数生成器。默认使用np.random的RandomState实例。
- shuffle:是否打乱。默认打乱。
- statify:数组。数据以分层方式分割,使用此作为标签,默认不进行。
实例:
data_train, data_test, label_train, label_test = train_test_split(data, label)