Python--pandas-数据选取loc、iloc、ix函数

基础概述

loc：通过行标签索引数据，例如取index为a的行；location的缩写
iloc：通过行号索引行数据，例如取第2行数据；Integer and location的缩写
ix：通过行标签或行号索引数据（基于loc和iloc的混合）；

基础使用用法

#!/usr/bin/python3
# -*- coding: utf-8 -*-
# @Time    : 2019-06-05 22:59
# @Author  : LiYahui
# @Description : 选取部分的数据
import pandas as pd
# 嵌套的嵌套序列数据结构
city_data = {'城市': pd.Series(['北京', '上海', '深圳', '成都', '杭州'], index=['a', 'b', 'c', 'd', 'e']),
             '人口/千万': pd.Series([2171, 2415, 1191, 901,899], index=['a', 'b', 'c', 'd', 'e']),
             '年份': pd.Series([2015, 2016, 2015, 2016, 2015], index=['a', 'b', 'c', 'd', 'e'])
             }
df1 = pd.DataFrame(city_data)
# print(df1)
'''
   城市  人口/千万    年份
a  北京   2171  2015
b  上海   2415  2016
c  深圳   1191  2015
d  成都    901  2016
e  杭州    899  2015
'''

利用loc、iloc提取行数据

提取单行数据

# 利用loc、iloc提取行数据
# 取索引为a的行
df2=df1.loc['a']
# print(df2)
'''
城市         北京
人口/千万    2171
年份       2015
Name: a, dtype: object
'''

#取第一行数据，索引为'a'的行就是第一行，所以结果相同
df3=df1.iloc[0]
# print(df3)
'''
城市         北京
人口/千万    2171
年份       2015
Name: a, dtype: object
'''
# 对比发现，df2和df3是完全一样的；

提取多行数据

# 取索引为a,c的行,索引必须放入一个list中
df2=df1.loc[['a','c']]
print(df2)
'''
   城市  人口/千万    年份
a  北京   2171  2015
c  深圳   1191  2015
'''

#取第一行、第三行数据，索引为'a'的行就是第一行，c就是第三行，所以结果相同
df3=df1.iloc[[0,2]]
print(df3)
'''
   城市  人口/千万    年份
a  北京   2171  2015
c  深圳   1191  2015
'''
# 对比发现，df2和df3是完全一样的；

利用loc、iloc提取列数据


df4=df1.loc[:,['城市']] # 取a列所有行，多取几列格式为 data.loc[:,['a','c','f']]
df6=df1.loc[:,['城市','年份']] # 取a列所有行，多取几列格式为 data.loc[:,['a','c','f']]
print(df4)
'''
   城市
a  北京
b  上海
c  深圳
d  成都
e  杭州
'''
print(df6)
'''
   城市    年份
a  北京  2015
b  上海  2016
c  深圳  2015
d  成都  2016
e  杭州  2015
'''
df5=df1.iloc[:,[0]] # 取第0列所有行，多取几列格式为 data.iloc[:,[0,2,5]]
print(df5)
'''
   城市
a  北京
b  上海
c  深圳
d  成都
e  杭州
'''

利用loc、iloc提取指定行、指定列数据

df7=df1.loc[['a','c'],['城市','年份']] #提取index为a、c，column为'城市','年份'的数据
print(df7)
'''
   城市    年份
a  北京  2015
d  成都  2016
'''
df8=df1.iloc[[0,3],[0,2]] # 提取第0、3行，第0、2列数据
print(df8)
'''
   城市    年份
a  北京  2015
d  成都  2016
'''

利用loc、iloc提取所有数据

df9=df1.loc[:,:]
print(df9)
'''
   城市  人口/千万    年份
a  北京   2171  2015
b  上海   2415  2016
c  深圳   1191  2015
d  成都    901  2016
e  杭州    899  2015
'''
df10=df1.iloc[:,:]
print(df10)
'''
   城市  人口/千万    年份
a  北京   2171  2015
b  上海   2415  2016
c  深圳   1191  2015
d  成都    901  2016
e  杭州    899  2015
'''

利用loc函数，根据某个数据来提取数据所在的行

df11=df1.loc[df1["城市"]=="杭州"] ##提取df1数据(筛选条件: 城市列中值为杭州所在的行数据)
print(df11)
'''
   城市  人口/千万    年份
e  杭州    899  2015
'''

ix用法

ix的操作比较复杂，在pandas版本0.20.0及其以后版本中，ix已经不被推荐使用，建议采用iloc和loc实现ix。
推荐学习博客：Python: pandas中ix的详细讲解

转载于:https://www.jianshu.com/p/2a4a618001bf