Python Pandas 快速插入列,快速筛选数据:强大到飞起的 eval 和 query 函数

在这里插入图片描述

引言

  在使用 Python 的 Pandas 库处理数据时,我们时常需要添加一些新列,时不时添加一列也就算了,同时添加多列(毫无规律的,不使用循环)时是真的气人,还有就是快速选择符合条件的数据框有时也会成为令人难受。

在这里插入图片描述



业务需求 & 效果实现

快到飞起的 eval()

在这里插入图片描述
笔者将效果实现分成了几个版本

低端累到不能呼吸版
  最基础的列操作了
在这里插入图片描述


中端客可喘气版
  这个版本借助了循环的帮助,省去了复制粘贴该改数字
在这里插入图片描述
已经快了很多
在这里插入图片描述


高端畅顺呼吸版
  使用 eval 函数的同时借助循环的帮助,这里就只是展示 eval 的生成单列的用法。
在这里插入图片描述



同样快到飞起的 query()

功能不多说,看图说话即可,只展示 query 最常用的功能
在这里插入图片描述



总结

  两个函数的简单和最常见的用法不用说大家看图也能够理解,就是省去了打出文件名和中括号,借助循环的力量,找出列索引的规律;在数据清洗/文件批处理中非常常见。

  这两个相对来说冷门一些的函数不仅代码量大大减少,而且在内存执行速度上也会更快;**从版本0.13开始,Pandas 包含了一下实验性的工具允许你直接使用 C 速度操作,避免中间数组的浪费。这些工具是eval()和 query()函数,它们依赖 Numexpr包。**其实这只是这两个函数的冰山一角,各种快捷骚操作还等待着我们去探索 Pandas,Numpy 的快捷函数太多了,所以鲜有人敢自称自己精通 numpy pandas 或者只是其中一个库(熊猫创始人曾在视频中也对此感到无奈)。总的来说,替自己总是忘记快捷函数而感到担忧是完全没有必要的,只需牢记没有最快,只有更快,想得起来就用想不起来就查。



后记

延伸阅读

精彩回顾

  数据分析,商业实践,数据可视化,网络爬虫,统计学,Excel,Word, 社会心理学,认知心理学,行为科学,民族意志学 各种专栏后续疯狂补充

  欢迎评论与私信交流!

发布了51 篇原创文章 · 获赞 29 · 访问量 8953

猜你喜欢

转载自blog.csdn.net/weixin_43329700/article/details/104607152