pandas drop_duplicates()函数去重 - 代码天地

pandas drop_duplicates()函数去重

企业开发 2022-05-09 22:04:01 阅读次数: 0

DataFrame.drop_duplicates(subset=None,keep='first',inplace=False)

参数：

subset 列标签，可以指定

keep first,last,False 分别表示保留第一次出现的重复行，最后一次出现的重复行，去除所有重复行

inplace True表示在原来数据删除重复项，默认False 生成新的副本

import numpy as np
from pandas import DataFrame
test = [['a','a'],
        ['a','b'],
        ['a','a'],
        ['c','b']
        ]
test = DataFrame(np.array(test))
test1 = test.drop_duplicates(keep='first')#删除重复项并保留第一次出现的额重复项
test2 = test.drop_duplicates([0],keep='first')#在第0列删除重复项
test2 = test.drop_duplicates([1],keep='first')#在第一列删除重复项
print(test)
print(test1)
print(test2)

猜你喜欢

转载自blog.csdn.net/weixin_52797843/article/details/124309260

pandas drop_duplicates()函数去重

pandas 去重函数 drop_duplicates() 和选取重复行函数 duplicated()

pandas drop_duplicates

dataframe去重 drop_duplicates

Pandas之去除重复项函数drop_duplicates()

【python】详解pandas dataframe 去重函数 pandas.DataFrame.drop_duplicates

python3中的drop_duplicates函数（对数据进行去重处理）

Pandas drop_duplicates的inplace属性

pandas.DataFrame.dropna | drop_duplicates

pandas中drop_duplicates用法

pandas包 —— drop()、sort_values()、drop_duplicates()

【pandas】[5] DataFrame通过drop_duplicates()函数找出重复的行

pandas去重保留前一条或后一条 drop_duplicates、打乱列表顺序 random.shuffle()的使用方法、pandas 按行遍历Dataframe

Pandas之drop_duplicates：去除重复项

pandas使用drop_duplicates去除DataFrame重复项

pandas使用drop_duplicates去除DataFrame重复项参数

pandas中的drop_duplicates和duplicated的应用

Pandas 数据重复处理 duplicated()和drop_duplicates()

python pandas dataframe 的去重函数

python pandas dataframe 去重函数

pandas数据处理实践三（DataFrame.apply、merge、rename，数据预处理、DataFrame.drop_duplicates去重）

pandas使用drop_duplicates去除DataFrame重复项参数详解

pandas去重方法

利用pandas去重

【pandas】数据去重

Python 文件导入数据导出数据去重drop_duplicates 去空值dropna 去空格strip 字段抽取slice 拆分split

pandas.DataFrame去重

Pandas条件查询与去重

Pandas数据处理/drop_duplicates()/映射map()/replace()/rename()/分箱/过滤异常值/随机抽样take()/random.permutation()

python、pandas文件合并、数据去重

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)