python数据分析处理库-Pandas基础操作

读取csv文件

import pandas as pd

numbers = pd.read_csv('./导航data.csv')
# 查看每个字段的类型
print(numbers.dtypes)

Filename object
Rating float64
dtype: object

读取数据

# 显示前五行
numbers.head()

# 显示最后10行
numbers.tail(10)

# 取csv的字段值
numbers.columus

在这里插入图片描述

# 取出第0行数据
numbers.loc[0]

# 取出第1行到第10行数据
numbers.loc[1:10]

# 取出某一列数据
numbers['Filename']
numbers['Filename','Rating']

查找数据

n = numbers.columns.tolist()
m = []
for c in n:
    if c.endswith('name'):
        m.append(c)
print(m)
print(numbers[m].head())

[‘Filename’]

 Filename

0 ftw1.jpg
1 ftw10.jpg
2 ftw100.jpg
3 ftw101.jpg
4 ftw102.jpg

增加一列运算后的数据

total = numbers['placing_has_navi_no_mileage']+numbers['placing_has_navi_has_mileage']
numbers['total'] = total

最大值、最小值、均值

print(numbers['total'].min())
print(numbers['total'].max())
print(numbers['total'].mean())

排序

按照total,从大到小排列

numbers.sort_values('total',inplace = True,ascending = False)

筛选

过滤total为空的数据

# 查找total里的缺失值的索引
totalnull = pd.isnull(total)
totalnull.shape
print(totalnull)
numbers[:][totalnull == False]

数据透视表

# index 行索引
# values 值
# aggfunc 数据统计方式
p = numbers.pivot_table(index='order_id',values='total',aggfunc=np.mean)

# 丢弃有缺失值的数据
numbers.dropna(axis=1)
# 如果total、placing_has_navi_no_mileage有缺失值,丢弃数据
numbers.dropna(axis=0,subset=['total','placing_has_navi_no_mileage'])

猜你喜欢

转载自blog.csdn.net/Super_RD/article/details/123470615