分割训练-测试数据:sklearn.model_selection.train_test_split()

定义:

train_test_split(*arrays, 
test_size=0.25,
train_size=None,
random_state=None,
shuffle=True,
statify=None)

返回:列表
参数:

  • *arrays:数据集。
  • test_size:如果为float,表示测试数据占比。如果为int,表示测试数据数量。如果为None,跟随train_size。默认为0.25。
  • train_size:训练数据数量,同test_size。默认跟随test_size。
  • random_state:随机数生成器。默认使用np.random的RandomState实例。
  • shuffle:是否打乱。默认打乱。
  • statify:数组。数据以分层方式分割,使用此作为标签,默认不进行。

实例:

data_train, data_test, label_train, label_test = train_test_split(data, label)

猜你喜欢

转载自blog.csdn.net/weixin_43793472/article/details/84491091