5、Python 数据分析-Pandas数据清洗【2】 - 代码天地

5、Python 数据分析-Pandas数据清洗【2】

其他 2020-06-29 16:48:13 阅读次数: 0

1、处理重复数据drop_duplicates函数

#设定一些重复行数据
df.iloc[1] = [0,0,0,0,0,0,0,0]
df.iloc[3] = [0,0,0,0,0,0,0,0]
df.iloc[5] = [0,0,0,0,0,0,0,0]
df.iloc[7] = [0,0,0,0,0,0,0,0]

df.drop_duplicates(keep='first')#keep='first'只保留第一次出现的重复数据，last相反，只保留最后一次出现的重复数据，其他重复数据不保留

2、处理异常数据

自定义一个10行3列（A，B，C）取值范围为0-1的数据源，然后将C列中的值大于其两倍标准差的异常值进行清洗

from pandas import DataFrame
import numpy as np

df = DataFrame(data=np.random.random(size=(10,3)),columns=['A','B','C'])
df.head(10)

#判定异常值的条件
std_twice = df['C'].std()*2
>>>
0.41596053666447336

# 将存有异常值的行进行删除
df['C'] > std_twice
# 将存有异常值的行数据取出
df.loc[df['C'] > std_twice]
# 获取异常值对应的行索引
indexs = df.loc[df['C'] > std_twice].index
df.drop(labels=indexs,axis=0)

猜你喜欢

转载自www.cnblogs.com/remixnameless/p/13208660.html

5、Python 数据分析-Pandas数据清洗【2】

【Pandas数据分析5】数据清洗

python数据分析pandas中的DataFrame数据清洗

python 数据分析8 pandas 数据清洗&预处理

4.Python 数据分析-基于pandas的数据清洗

Python数据分析5——数据清洗

Python数据分析_Pandas学习__2

2、Python 数据分析-Pandas【1】

Python - Pandas - 数据分析(2)

【100天精通Python】Day56：Python 数据分析_Pandas数据清洗和处理

python数据分析05——Pandas数据清洗、转换和面元划分

python 数据分析基础 day18－使用pandas进行数据清洗以及探索

基于 Python 和 Pandas 的数据分析(2) --- Pandas 基础

python pandas数据分析

python 数据分析--pandas

Python数据分析-Pandas

【Python数据分析】数据预处理1——数据清洗

python-数据分析与展示（Numpy、matplotlib、pandas）---2

Python数据分析与机器学习-Pandas_2

《利用Python进行数据分析》---pandas入门2

小白学 Python 数据分析（2）：Pandas （一）概述

python数据分析 pandas库的学习（2）

利用Python进行数据分析第7章数据清洗和准备（2）

【Python数据分析学习笔记Day3】（三）数据分析工具pandas，数据清洗，聚类K-Means

Python数据分析实战（2）使用Pandas进行数据分析

【Python 数据分析】pandas数据导入

Python数据分析_Pandas数据框

Python数据分析：pandas数据合并

《利用Python进行数据分析·第2版》第5章 pandas入门

基于 Python 和 Pandas 的数据分析(5) --- Concatenating and Appending

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)