pandas减少数据内存使用率/提高计算效率方法 - 代码天地

pandas减少数据内存使用率/提高计算效率方法

其他 2020-03-21 11:21:15 阅读次数: 0

数据量大的时候、或者内存紧张、想着提高计算效率，加一下这个（可节省50%+内存同时提高计算效率）：

def reduce_mem_usage(df, verbose=True):
    numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64']
    start_mem = df.memory_usage().sum() / 1024 ** 2
    for col in df.columns:
        col_type = df[col].dtypes
        if col_type in numerics:
            c_min = df[col].min()
            c_max = df[col].max()
            if str(col_type)[:3] == 'int':
                if c_min > np.iinfo(np.int8).min and c_max < np.iinfo(np.int8).max:
                    df[col] = df[col].astype(np.int8)
                elif c_min > np.iinfo(np.int16).min and c_max < np.iinfo(np.int16).max:
                    df[col] = df[col].astype(np.int16)
                elif c_min > np.iinfo(np.int32).min and c_max < np.iinfo(np.int32).max:
                    df[col] = df[col].astype(np.int32)
                elif c_min > np.iinfo(np.int64).min and c_max < np.iinfo(np.int64).max:
                    df[col] = df[col].astype(np.int64)
            else:
                if c_min > np.finfo(np.float16).min and c_max < np.finfo(np.float16).max:
                    df[col] = df[col].astype(np.float16)
                elif c_min > np.finfo(np.float32).min and c_max < np.finfo(np.float32).max:
                    df[col] = df[col].astype(np.float32)
                else:
                    df[col] = df[col].astype(np.float64)
    end_mem = df.memory_usage().sum() / 1024 ** 2
    if verbose:
        print('Mem. usage decreased to {:5.2f} Mb ({:.1f}% reduction)'.format(
            end_mem, 100 * (start_mem - end_mem) / start_mem))
    return df

MachineLP CodeFun：https://github.com/MachineLP/MachineLP-CodeFun

MachineLP

发布了342 篇原创文章 · 获赞 794 · 访问量 178万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/u014365862/article/details/103411981

pandas减少数据内存使用率/提高计算效率方法

内存使用率计算

【linux 内存使用率】linux内存使用率计算

提高CPU使用率

计算Android总的内存使用率、CPU使用率和CPU实时主频率

正确计算linux系统内存使用率

Linux系统内存使用率该怎么计算

检测内存的使用率

Linux 内存使用率

带宽使用率计算～

cpu使用率计算

cpu使用率的计算

java获得CPU使用率，内存使用率

Linux查看CPU使用率、内存使用率等

【Pandas】Pandas处理大数据集的方法（内存优化，减少内存使用量90%）

iOS App在运行过程中占用系统内存的方法和CPU使用率的计算方法

VBS脚本得到CPU使用率,硬盘使用率和内存使用率

java获取cpu使用率/内存使用率/硬盘的使用率

Linux系统查看CPU使用率、内存使用率、磁盘使用率

内存使用率—Free命令

shell判断内存使用率告警

MySQL内存使用率无限增长

获取内存使用率（Linux C）

shell脚本-巡检内存使用率

zabbix监控内存使用率

shell脚本-监控内存使用率

如何查看Linux的内存使用率

Centos7 内存使用率计算_linux内存指标

Linux平台Cpu使用率的计算

【Linux】查看/计算CPU使用率

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

女程序员是这样被恶搞的

B/S 和 C/S 的优缺点

vector一直申请会怎样？

座头鲸识别比赛(Humpback Whale Identification)总结

Linux高性能服务器编程——I/O复用 select

Mysql连接数据库（当包使用）

通过URI获取的文件路径为null的解决方法

1022-Primes on Interval(素数筛选+二分查找) ZCMU

Python出现： TypeError: expected string or buffer

bzoj2434: [Noi2011]阿狸的打字机 ac自动机+树状数组

每日归档

更多

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)