使用SQL方式打开Pandas

SQL方式打开pandas


pandas的数据类型可以让我们像处理数据表一样进行操作,比如数据表的增删改查,都是可以使用pandas工具来完成。不过由于pandas的函数及其相应的方法太多,很多时候我们很难记住,大多数情况下,需要去查询相应的文档。相比之下,可能对于SQL还是更加熟练,用SQL对数据表进行操作是最方便的。

pandasql

在python里可以直接使用sql语句来操作pandas
工具:pandasql

pandasql中的主要函数是sqldf,它接收两个参数:一个是SQL查询语句,还有一组环境变量globals()或locals()。这样的话,我们便可以在python中,直接使用sql语句对我们的Dataframe进行操作。
举个例子:


import pandas as pd
from pandas import DataFrame
from pandasql import sqldf, load_meat, load_births
df1 = DataFrame({
    
    'name':['ZhangFei', 'GuanYu', 'a', 'b', 'c'], 'data1':range(5)})
pysqldf = lambda sql: sqldf(sql, globals())
sql = "select * from df1 where name ='ZhangFei'"
print pysqldf(sql)

运行结果:


   data1      name
0      0  ZhangFei

lambda匿名函数

上面这个例子中,我们是对“name = ‘ZhangFei’ ”的行进行了输出。上面可以看到我们使用了lambda, lambda在python中的使用频率相对而言比较高,那么lambda是用来做什么的呢?实际上它是python中的一个匿名函数,具体的使用形式为:

lambda argument_list:expression

这里argument_list是参数列表,expression是关于参数的表达式,会根据expression表达式计算结果进行输出返回。
这里对于匿名函数做一个简要介绍,因为打算写一篇专门介绍匿名函数的文章。

对于panda中使用sql进行数据的处理,到这里就算是结束了。希望在记录学习过程、加强记忆的同时能帮助到其他的小伙伴!!!

Guess you like

Origin blog.csdn.net/baidu_41797613/article/details/120326915