python数据分析处理库-Pandas基础操作

企业开发 2023-09-18 22:31:03 阅读次数: 0

读取csv文件

import pandas as pd

numbers = pd.read_csv('./导航data.csv')
# 查看每个字段的类型
print(numbers.dtypes)

Filename object
Rating float64
dtype: object

读取数据

# 显示前五行
numbers.head()

# 显示最后10行
numbers.tail(10)

# 取csv的字段值
numbers.columus

在这里插入图片描述

# 取出第0行数据
numbers.loc[0]

# 取出第1行到第10行数据
numbers.loc[1:10]

# 取出某一列数据
numbers['Filename']
numbers['Filename','Rating']

查找数据

n = numbers.columns.tolist()
m = []
for c in n:
    if c.endswith('name'):
        m.append(c)
print(m)
print(numbers[m].head())

[‘Filename’]

 Filename

0 ftw1.jpg
1 ftw10.jpg
2 ftw100.jpg
3 ftw101.jpg
4 ftw102.jpg

增加一列运算后的数据

total = numbers['placing_has_navi_no_mileage']+numbers['placing_has_navi_has_mileage']
numbers['total'] = total

最大值、最小值、均值

print(numbers['total'].min())
print(numbers['total'].max())
print(numbers['total'].mean())

排序

按照total，从大到小排列

numbers.sort_values('total',inplace = True,ascending = False)

筛选

过滤total为空的数据

# 查找total里的缺失值的索引
totalnull = pd.isnull(total)
totalnull.shape
print(totalnull)
numbers[:][totalnull == False]

数据透视表

# index 行索引
# values 值
# aggfunc 数据统计方式
p = numbers.pivot_table(index='order_id',values='total',aggfunc=np.mean)

# 丢弃有缺失值的数据
numbers.dropna(axis=1)
# 如果total、placing_has_navi_no_mileage有缺失值，丢弃数据
numbers.dropna(axis=0,subset=['total','placing_has_navi_no_mileage'])

猜你喜欢

转载自blog.csdn.net/Super_RD/article/details/123470615

python数据分析处理库-Pandas基础操作

Python数据分析处理库Pandas

python数据分析处理库-Pandas

数据分析基础:Pandas的操作-Python

数据分析处理库Pandas——常用操作

数据分析处理库Pandas——字符串操作

Python数据分析：pandas时间序列处理及操作

Python数据分析库pandas基本操作

Python 数据分析：pandas 操作基础篇

[Python基础] 3.Pandas:数据分析库

Python 数据分析与展示笔记4 -- Pandas 库基础

数据分析处理库Pandas

数据分析处理库--Pandas

数据分析处理库-pandas

数据分析处理库——Pandas

数据分析处理库Pandas——概述

【python数据分析】pandas基本操作

python pandas数据分析操作

Python与数据分析--Pandas操作进阶

Python数据分析库pandas ------ DataFrame

python高级--数据分析(Pandas库)

Python 的数据分析库-pandas

Python数据分析库Pandas

Python数据分析库：Pandas

Python数据分析之Pandas库

Python数据分析-pandas库入门

Python 数据分析包：pandas 基础

python数据分析pandas基础用法

【A-003】python数据分析与机器学习实战 Python科学计算库 Pandas数据分析处理库（一）

【A-003】python数据分析与机器学习实战 Python科学计算库 Pandas数据分析处理库（二）

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)