sklearn 缺失值填补（总结） - 代码天地

sklearn 缺失值填补（总结）

其他 2019-06-07 13:34:46 阅读次数: 0

首先查看数据形态：

data.shape

再查看数据类型和非空值的个数与比例

data.info()

使用SimpleImputer进行填补

from sklearn.impute import SimpleImputer as si
imp_mean=si()

默认是用均值进行填补，参数如下：

missing_values: 空值的类型。默认np.nan

注意，numpy自带的fillna只能填补np.nan，而此处则可以指定空值的类型。比如? 或N/A

strategy: 可选：mean, median, most_frequent, constant
fill_value: 以什么值进行填补，当constant时可用。
copy：是否创建副本

当数据是连续型，一般用均值填补。数据是分类型，用众数填补。

比如当空值是?时，使用0填充：

imp_0=si(missing_values="?",strategy='constant', fill_value=0)
imp_0=imp_0.fit_transform(data_)

注意此处，data是如果是0维，则要先变为一维：

data_=data.列名.values.reshape(-1.1)

除了用均值，0，众数，中位数。还可用：算法、多重差补等。但是如用随机森林进行填补，解释性比较差。

猜你喜欢

转载自www.cnblogs.com/heenhui2016/p/10987948.html

sklearn 缺失值填补（总结）

【skLearn 练习】随机森林回归填补缺失值

sklearn—总结

sklearn总结

缺失值填补

数据缺失值填补

使用sklearn中preprocessing.Imputer实现对缺失值的处理

缺失值处理（分层填补）

sklearn技巧总结

SKlearn | 学习总结

sklearn

ｓｋｌｅａｒｎ

sklearn.preprocessing里缺失Imputer函数

【R】填补vector中缺失值

pandas填补缺失值的方法

R语言【2.5 缺失值的填补与处理】

RandomForestRegressor&填补缺失值

sklearn.preprocessing用法总结

sklearn中的pipeline的用法总结

sklearn库常用方法总结

sklearn imputer填充方法总结

python从入门到放弃篇19（pandas,numpy,sklearn)缺失值处理

SKlearn--用户手册 -5.4.缺失值的插补（中文版）

sklearn.preprocessing.Imputer，用来填充缺失值或者特定值的，相当于fillna()+dataframe结构中的排序问题

机器学习（sklearn）的常用算法总结

SKlearn中的svm超参数总结

总结：sklearn机器学习之特征工程

sklearn之模型评估指标总结归纳

练习总结 +sklearn参数选择调优

机器学习模型评分总结（sklearn）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)