Python操作Excel之数据提取 - 代码天地

Python操作Excel之数据提取

企业开发 2020-03-05 11:10:15 阅读次数: 0

最近发现excel数据量极大，并且通过简单的数据操作不能提取到我需要的数据，如果单独操作，数据量太大耗时太长。
想着通过简单的方式，并且快速提取数据，就想到了Python。
python操作Excel使用的openyxl和pandas对Excel进行操作。
代码如下：

#!/usr/bin/env python
# -*- coding: utf-8 -*-
# @Time    : 2020-02-24 下午 03:43
# @Author  : Zhanxing
# @Site    :
# @File    : 提取字段.py
# @Software: PyCharm

import openpyxl
import pandas as pd
from xlutils.copy import copy
df=pd.read_excel('222.xlsx',sheet_name='XXX')

data=(df[['XXX','XXX']])
data.to_excel("new.xlsx", index=False)

class Excel:
    def __init__(self, excel_file):
        self.excel = openpyxl.load_workbook(excel_file)
        self.sheet_name = self.excel.get_sheet_names()
        self.sheet = self.excel.get_sheet_by_name(self.sheet_name[0])

    def excel_read(self):
        """
        返回excel每一行的生成器对象
        :return:
        """
        yield from self.sheet.iter_rows(min_row=2)

def run(excel_file, new_excel):
    """
    :param excel_file: 要处理的excel的路径
    :param new_excel:  处理后要保存的文件名
    :return:
    """
    excel = Excel(excel_file)
    excel_line = [line for line in excel.excel_read()]
    for line in excel_line:
        for cell in line:
            if isinstance(cell.value, int):
                continue
            people_name = cell.value.strip('[]').split(',')
            for num in range(len(people_name)):
                if 'XX' in people_name[num]:
                    excel.sheet.cell(row=cell.row, column=cell.column, value=people_name[num])
                    break
    excel.excel.save(new_excel)

if __name__ == '__main__':
    run('new.xlsx','11.xlsx')

猜你喜欢

转载自blog.51cto.com/zhanx/2475595

Python操作Excel之数据提取

python 提取Excel数据

python提取excel表格数据

python实现excel的数据提取

Python之数据提取

python之excel操作

Python之操作excel

Python之数据报表之Excel操作模块

python之数据驱动Excel操作（方法一）

python之数据驱动Excel+ddt操作（方法二）

操作Excel之导出数据成Excel

python之excel相关操作

Python操作office之Excel

python之excel基本操作

Python操作Excel 之 openpyxl

Python 之Excel文档操作

python操作excel之xlwings

Python操作excel之openpyxl

python操作Excel之openxlpy

对excel提取数据

Python: Excel数据的读写操作

Python数据分析实战-提取DataFrame（Excel）某列（字段）最全操作（附源码和实现效果）

Python数据分析实战-提取DataFrame（Excel）某行（记录）最全操作（附源码和实现效果）

python 批处理excel文件实现数据的提取

如何用python提取Excel中指定列名的数据

Python办公自动化，批量提取Excel数据。

Python办公自动化｜批量提取Excel数据

【Python提取Excel表格中符合条件的数据】

python提取pdf表格数据并保存到excel中

Python学习笔记之--实验室燃烧分析仪vie数据提取---生成excel文件

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)