使用Python快速打开一个千万级别的超大Excel文件，提速数百倍 - 代码天地

使用Python快速打开一个千万级别的超大Excel文件，提速数百倍

其他 2021-04-03 15:42:14 阅读次数: 0

代码很短，为了节省时间就不说思路了，直接看下边的代码就可以。

import pandas as pd  # pandas版本0.25.1
import numpy as np  # numpy版本1.16.3
import time

t0 = time.time()
data = pd.read_excel(
    'data.xlsx',
    encoding='gb2312'  # 添加encoding='gb2312'使得能够读取中文
)
t1 = time.time()
cost1 = t1-t0

data_ndarray = data.to_numpy()
np.save('data.npy', data_ndarray)

t2 = time.time()
data_ndarray1 = np.load('data.npy')
t3 = time.time()
cost2 = t3-t2

实验结果截图如下，如图中所示，excel文件中数据的size是12247254（已达千万级别），大约有45万行，27列的数据。
第一次直接读取excel文件的耗时为206.379秒
第二次读取npy文件的耗时仅为0.799秒
约提高了258.32倍

在这里插入图片描述
欢迎转载，但是请明确地标注清楚源自CSDN千行百行。不加标注，虽远必诛！！！
本文链接：https://blog.csdn.net/shiyuzuxiaqianli/article/details/114803360
————————————————————————————————————————

猜你喜欢

转载自blog.csdn.net/shiyuzuxiaqianli/article/details/114803360

使用Python快速打开一个千万级别的超大Excel文件，提速数百倍

java直接打开一个Excel文件

xdag下一个百倍币

Python创建并且打开一个mat文件

打开Excel文件会多打开一个PERSONAL.XLSB文件

打开一个文件的过程

这款编译器能让Python和C++一样快：最高提速百倍，MIT出品

这款编译器能让Python和C++一样快！最高提速百倍，MIT出品！

解决：Office 每次打开 Excel的同时会打开一个新的sheet 1 的excel 文件

一个月暴涨百倍！？穿透FCOIN的魔术秘密

继Fcoin之后，谁是下一个百倍币？

下一个百倍币？ont全面解析

解密TDChain如何成为下一个百倍增值项目

背水一战 Windows 10 (98) - 关联启动: 使用外部程序打开一个文件, 使用外部程序打开一个 Uri

MFC 打开一个文件夹/文件

8.3 打开一个文件并显示该文件

explain的属性详解与提速百倍的优化示例

组织架构数据同步效率优化，百倍提速

如何打开一个EAP文件

Django简单打开一个文件

MFC打开一个文件方法汇总

f_open——创建/打开一个文件

如何通过DOS命令打开一个文件

qt打开一个exe文件

利用python打开一个代理网页

使用IntelliJ IDEA打开一个项目步骤

如何使用Spyder新建/打开一个python的项目

[Python3 爬虫学习笔记]Selenium使用详解 1 -- 打开一个页面

使用python打开一个会话进程并持续输入

如何使用Spyder打开一个python的项目或爬虫项目-is not a Spyder project解决

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)