pandas读取20W数据excel，每999行生成一个查询sql语句 - 代码天地

pandas读取20W数据excel，每999行生成一个查询sql语句

其他 2018-11-05 03:09:04 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/s740556472/article/details/83341395

前言

工作中遇到一个小问题，Oralce数据库的查询是不能大于1000条in查询的，所以需要对文件进行切割。数据源是20w的excel数据，于是想到用pandas对其进行读取，然后每998行生成一个新的sql文件。

代码实现

# coding = utf-8

"""
@author: sy

@file: readexcel.py

@time: 2018/6/15 10:11

@desc:

"""
import pandas as pd

#from multiprocessing.dummy import Pool as ThreadPool
#from functools import partial 本想试下多线程


def read_data():
    short_data = pd.read_excel('C:/Users/sy/Desktop/split/data.xlsx', sheet_name='Sheet1')
    short_data = short_data.fillna(-1)
    sql_str = 'select t.policyno from xxxxx t where t.policyno in ('
    sum_sql = ''
    # pandas 读取的类型为DataFrame,也是可迭代的对象
    for i, excel_policy_no in enumerate(short_data['保单号']):
        sum_sql += "'" + str(excel_policy_no) + "',"
        if i != 0 and i % 997 == 0:
            sum_sql += "'" + str(excel_policy_no) + "');"
            sql = sql_str + sum_sql
            thread_function(i, sql)
            sum_sql = ''


def thread_function(i, sql):
    write_sql('C:/Users/sy/Desktop/split/' + str(i) + '.sql', sql)


def write_sql(filename, content):
    with open(filename, 'a', encoding='utf-8') as f:
        f.write(content)


if __name__ == '__main__':
    read_data()

总结

耗时多数在读取20W数据的时候，读取excel时，一次全读到内存中了，所以比较慢，像pandas自带的csv读取，可以进行分块读取。excel我查阅了相关官方文档，并没有看到相应属性，若有更好的方式欢迎留言讨论！

猜你喜欢

转载自blog.csdn.net/s740556472/article/details/83341395

pandas读取20W数据excel，每999行生成一个查询sql语句

如何能快速的成为一个年薪20w的前端程序员？

excel中如何让每n行显示同一个数据

【Python-数据读取】读取txt文件每一行数据生成列表

访问20W了

本地MySQL与阿里云RDS MySQL 20W条数据查询速度对比

本地MySQL与阿里云RDS MySQL 20W条数据查询速度对比

Python读取Excel每一行为列表—大PK(openpyxl\pandas\xlwings\xlrd)看谁用时少？

一个sql查询语句

《哪吒》大火，爬取20W 评论数据，并用AI分析了一波，结果......

爬取 20W 猫猫数据，来了解一下喵喵~

22. 每读十行生成一个新文件

数据分析法宝，一个 SQL 语句查询多个异构数据源

sql查询当天,一周,一个月数据的语句

sql语句临时表删除，sql语句去重，sql语句从两个表中查询到数据放到同一个临时表输出

转：一个SQL查询出每门课程的成绩都大于80的学生姓名

一个SQL查询出每门课程的成绩都大于80的学生姓名

记一个实用的sql查询语句

(转)把excel数据生成sql insert语句

根据Excel数据生成sql语句

pandas读取excel并合并多个sheet到同一个文件中

Python读取txt文件应用---用python实现读取一个txt文档，并根据相应判断条件在txt文件中，每一行内写入指定数据。

oracle数据库里面查询昨天的时间--sql语句查询--一个面试题目

SQL练习55：分页查询employees表，每5行一页，返回第2页的数据

从Excel生成sql语句

Excel生成SQL语句

一个参数一个xlsx表，让你玩转Pandas中read_excel()表格读取！

java导出excel，每1000新建一个sheet

python pandas读取数据库sql导出excel

批量读取excel中每一行的值并分类赋值储存到csv文件中

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)