python对excel表某一列去重 - 代码天地

python对excel表某一列去重

企业开发 2023-09-30 15:30:07 阅读次数: 0

其实第三方库pandas已经实现了这个功能, 但是为啥我还要自己重新写一个方法呢, 用过pandas你就会发现, 虽然可以去重, 但是最左边会莫名其妙多出一列序号, 好像这个去重方法还必须要传入去重列的字段名, 不能按列号去重, 最烦的是当对身份证号码去重时, 新生成的excel中身份证号码列竟变成了科学计数法....可能我是没有掌握pandas去重的要领吧, 算了, 自己动手造个轮子吧! 直接上代码:

import openpyxl

wb = openpyxl.load_workbook('C:/Users/Administrator/Desktop/a.xlsx')
ws = wb.worksheets[0]
print(ws.max_row)
ws.append(['a', 'b'])


def drop_duplicates(column):
    lst2 = []
    for i in range(1, ws.max_row):
        lst1 = list(ws.rows)[i - 1]
        for row in list(ws.rows)[i:]:
            lst2.append(row[column].value)
        if lst1[column].value in lst2:
            lst2 = []
            continue
        else:
            ws.append([r.value for r in lst1])
            lst2 = []

# 身份证格式化处理, 带表头的处理
def format_cardid(column):
    for index, row in enumerate(list(ws.rows)[1:]):
        if 'x' in row[column].value:
            ws.cell(index + 2, column + 1, row[column].value.replace('x', 'X'))

# 身份证格式化处理, 不带表头的处理
def format_cardid(column):
    for index, row in enumerate(list(ws.rows)):
        if 'x' in row[column].value:
            ws.cell(index + 1, column + 1, row[column].value.replace('x', 'X'))


drop_duplicates(6)
wb.save('C:/Users/Administrator/Desktop/a.xlsx')

简单解释一下, 同样需要引用openpyxl包, 这里我用了和pandas里一样的函数名称, 传入要去重的列号即可, 注意:当身份证号码中存在x大小写时, 你需要统一, 否则不能去重, 在代码里我又加上了处理身份证格式化的代码, 把x统一格式化为X

猜你喜欢

转载自blog.csdn.net/phoenix3k/article/details/125144490

python对excel表某一列去重

Excel如何对某一列进行去重

spark rdd根据某一列去重

Python利用pandas对Ecxel文件以某一列进行去重并保存

SQL查询所有列根据根据某一列去重

python对excel操作获取某一列，某一行的值，对某一列信息筛选

Python数据分析实战-将dataframe某一列的去重并统计去重后数量（附源码和实现效果）

Linux命令根据某一列对文件内容去重

SQL按照某一列数据去重并显示整行信息

Oracle SQL按照某一列数据去重并显示整行信息（以一列为基准去重）

学习excel的使用技巧复制一列文本成新列去重

mysql 删除表中某一列的数据及删除某一列的方法

python读取excel文件的某一列数据，并将数据存放到数组中

用python自动复制粘贴excel表里某一列的数据到另一个表中

删除excel中某一列的重复项

如何删除excel某一列中某些字符

Excel为某一列数据添加特定文字

根据某一列拆分Excel为多个表格

批量删除Excel文件中的某一列 VBA

EXCEL以某一列的值的条件,分别统计另外一列的数值

如何在excel表格某一列前添加一列相同数据

python按照某一列/指定列进行筛选

pandas读取excel文件某一sheet里的某一列列

Sqlite之修改表中某一列

mysql 查询某一列在哪张表中

mysql 修改表中某一列的值

使用Python中pandas按照某一列把一个Excel文件拆分为多个Excel文件

根据excel表格中的某一列内容，使用python将其拆分成多个excel表格

excel表把某一列中相同值进行合并，把该值对应的各行的值进行合并

excel计算数据时固定某一列或一行或某一值

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)