pandas填补缺失值的方法 - 代码天地

pandas填补缺失值的方法

其他 2020-02-17 10:23:26 阅读次数: 0

pandas填补缺失值的方法

在处理数据的过程中，经常会遇到原数据部分内容的缺失，为了保证我们最终数据统计结果的正确性，通常我们有两种处理方式，第一种就是删除掉这些部分缺失的数据；第二种就是填补这些缺失的数据。接下来，我们主要介绍填补缺失值的方法。

填充法

咱们所用到的数据：
在这里插入图片描述

import pandas as pd
import numpy as np

planets = pd.read_csv('planets.csv')
print(planets.head(10))
print(planets.notnull().nunique())#这里用来判断数据中是否存在为空，并且那些列存在为空的值
planets.fillna(value={'distance':planets['distance'].mean(),'mass':0,'orbital_period':0},inplace=True)
print("===============填充完毕=================")
print(planets.notnull().nunique())

好了，咱们先看一下运行结果：
在这里插入图片描述
接下来具体解释一下代码：

首先我们读取数据，然后使用head(10)获取数据的前十行数据
notnull()方法是用来判断数据是否为空的，如果为空，返回False
接着跟着一个nunique() 这个方法是判断有多少不同的值。我的思路就是先通过notnull方法将空值和非空值分别使用False和True来表示，再使用nunique方法判断存在几种值。若该数为2，则代表该列中存在空值。反之若为1，则不存在空值。
fillna(value={‘columns’:value},inplace=True) 这个方法是用来填充空值的。value这个参数需要传入字典型数据。若数据中有两列需要填补空值的，则需要写上两列的列名和需要填补的值。通常情况我们会使用mean()方法填入均值。
接着我们再使用3中的两个方法进行判断我们是否填值成功。

使用的planets数据链接：

planets数据下载链接

梁先森-小白进击之路

发布了48 篇原创文章 · 获赞 34 · 访问量 23万+

私信关注

猜你喜欢

转载自blog.csdn.net/lzx159951/article/details/104352576

pandas填补缺失值的方法

使用普通机器学习的方法填补缺失值

RandomForestRegressor&填补缺失值

Python 填补缺失值 Pandas SimpleImputer 随机森林模型（机器学习）

【Python实例第4讲】填补缺失值

【skLearn 练习】随机森林回归填补缺失值

缺失值填补

数据缺失值填补

缺失值处理（分层填补）

sklearn 缺失值填补（总结）

五、实例：在波士顿房价数据集上用随机森林回归填补缺失值

pyspark fill missing date，填补缺失日期数据

R语言：用R语言填补缺失的数据

【R】填补vector中缺失值

R语言【2.5 缺失值的填补与处理】

缺失数据填补基础方法（2）——Random Forest (MissForest)填补

面经｜缺失值填补的7种方法（使用场景+Python代码）

GEE：提取研究区 NDVI/LST/RVI 并进行时间序列线性插值填补缺失像素和Savitsky-Golay（SG）滤波平滑处理

pandas缺失值处理

pandas 处理缺失值

Pandas 填充缺失值

Pandas对缺失值的处理

pandas 筛选缺失值

python学习——pandas fillna()填补空值

java 按日期范围统计数据并填补缺失日期数据

图片修补 EdgeConnect 论文的阅读与翻译：生成边缘轮廓先验，再填补缺失内容

pandas基础属性方法随机整理（六）--- 缺失值处理

pandas检查、填充缺失值的几种方法总结

100天精通Python（数据分析篇）——第68天：Pandas数据清洗函数大全（判断缺失、删除空值、填补空值、替换元素、分割元素）

Python 缺失值的填补（以TItanic数据集为例）

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)