In [2]:
import pandas as pd
import numpy as np
In [5]:
s = pd.Series(np.arange(5),index = np.arange(5)[::-1],dtype='int64')
s
Out[5]:
In [8]:
s.isin([1,3,4])
Out[8]:
In [11]:
s[s.isin([1,3,4])]
Out[11]:
In [13]:
s2 = pd.Series(np.arange(6),index = pd.MultiIndex.from_product([[0,1],['a','b','c']]))
s2
Out[13]:
In [14]:
s2.iloc[s2.index.isin([(1,'a'),(2,'b')])]
Out[14]:
In [15]:
s2.iloc[s2.index.isin([(1,'a'),(0,'b')])]
Out[15]:
In [18]:
s = pd.Series(np.arange(5),index = np.arange(5)[::-1],dtype='int64')
s
Out[18]:
In [19]:
s[s>2]
Out[19]:
In [20]:
dates = pd.date_range('20171022',periods=8)
In [22]:
df = pd.DataFrame(np.random.randn(8,4),index=dates,columns=['A','B','C','D'])
df
Out[22]:
In [23]:
df.select(lambda x:x=='A',axis='columns')
Out[23]:
- where() 在数据表中查看小于0的数据,大于0的数据默认显示NaN
In [24]:
df.where(df<0)
Out[24]:
* where() 在数据表中将不符合条件的数据,默认显示为NaN替换成其他的数据。
In [26]:
df.where(df<0,'A')
Out[26]:
In [27]:
df = pd.DataFrame(np.random.rand(10,3),columns = list('abc'))
df
Out[27]:
In [28]:
df.query('(a<b)')
Out[28]:
In [30]:
df.query('(a<b)&(b<c)')
Out[30]:
In [ ]: