python笔记8:数据处理之去除重复数据

其他 2019-01-17 14:12:32 阅读次数: 0

# -*- coding: utf-8 -*-
#1. 概念：把数据结构中，行相同的数据只保留一行。
# 语法： drop_duplicates 该方法返回一个去重后的数据框对象

from pandas import read_csv

df = read_csv("D:/python/workspace/pythonStudy/8.csv")

#找出行重复的位置（索引值）
dIndex = df.duplicated() #返回一列布尔值。如果某行数据没有出现过，则返回False，否则返回True

#找出列重复位置
dIndex = df.duplicated('id') #返回id这一列重复的位置

dIndex = df.duplicated(['id','key']) #这两列同时重复的位置

#根据上面的返回值，把重复数据提取出来
df[dIndex]

#删除重复值
#默认根据所有的列，进行删除（当某两行所有列的数据都重复时，会删除其中一行）
newDf = df.drop_duplicates()

#当然也可以指定某一列或多列，进行重复值删除
newDf = df.drop_duplicates("id")
newDf = df.drop_duplicates(["id","key"])

猜你喜欢

转载自blog.csdn.net/aiyo92/article/details/86480958

python笔记8:数据处理之去除重复数据

重复数据处理

python笔记10:数据处理之去除空格

R+重复数据处理

PostgreSQL 重复数据处理

去除重复数据

python list列表去除重复数据

数据库重复数据处理

数据清洗（一）-----------重复数据处理

MATLAB数据处理系列-重复数据的剔除

oracle去除重复数据

sql去除重复数据

MySQL去除重复数据

MYSql 去除重复数据

execl去除重复数据

JSON去除重复数据

jQuery 去除重复数据

ArrayList去除重复数据

Python 数据分析三剑客之 Pandas（八）：数据重塑、重复数据处理与数据替换

oracle 重复数据处理的sql整理

避免MySQL出现重复数据处理方法

SQL去除重复删除重复数据

MySQL之重复数据的处理

mysql中去除重复数据之distinct用法

mysql使用技巧之去除重复数据

数据库去除重复数据

python 数据处理笔记

Python数据处理笔记

python笔记20:数据处理之数据分组

python笔记7:数据处理之导出数据

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)