数据预处理——二元化

模型原型

class sklearn.preprocessing.Binarizer(threshold=0.0,copy=True)
参数

  • threshold:指定属性阙值
  • copy:如果为True,则执行原地修改

方法

  • fit(X,[,y]):不做任何事,主要用于流水线Pipeline
  • transform(X[,y,copy]):将每一个样本的属性二元化
  • fit_transform(X[,y]):将每一个样本的属性二元化

示例

from sklearn.preprocessing import Binarizer
X=[
    [1,2,3,4,5],
    [5,4,3,2,1],
    [3,3,3,3,3],
    [1,1,1,1,1]
]
print('before transform:\n',X)
binarizer=Binarizer(threshold=2.5)
print('after transform:\n',binarizer.transform(X))

猜你喜欢

转载自blog.csdn.net/weixin_39777626/article/details/79935898