python pandas随笔（通用操作） - 代码天地

python pandas随笔（通用操作）

其他 2019-05-07 00:04:50 阅读次数: 0

index对象：

idmin()：用来获取索引长度最小的索引名。

idmanx()：与idmin() 相反

index对象允许同名索引存在。判断数据中是否有重名索引存在，可以用is_unique 例：frame.index.is_unique

删除：

drop()：

其中有个axis参数，在多维数据时，要用到，初始为0，则删除行，当值为1时，删除列。

例：frame.drop(["name",axis=1) > 删除name列

算术与数据对齐：

两个数据对象可以进算术运算，但是运算时，只有两个数据对象都有相对索引和对象时，才能运算，没有相同时，则为NaN值

DataFrame 数据类型也是一样，只是多了一个字段要相同。

数据结构之间的运算：

数据之间运算很灵活，不同维度数组也可以进行运算。如，可以通过函数来相加 add()

其中还有sub()、div()、mul() 等

DataFrame与Series对象之间也可以运算。但注意的是Series对象与DataFrame的字段要相同，而且只计算第一行

函数的应用：

使用自定义函数(apply):

库函数的使用

排序：

sort_index()：以索引排序。参数ascending用于排序方式，默认升序，当为False时，为降序

其中参数axis，用于多维数组axis=0 默认为0，当为0时，以索引排序，当为1时，以字段排序。

参数by，同样也用于多维数组，使用某列或多列排序。

sort_values()：以value值进行排序。参数同上

排位次

rank()：方法用于根据某种函数规则进行排序。

重要参数：axis > 用于排序方式。0为索引。1为字段。默认为0

method > 用于排序函数。其中包含 {'average', 'min', 'max', 'first', 'dense'} 默认 average

....

解释：因为默认是求平均值，其中有两个相同元素。1和2,

它们排序是值 -3 排第一位，值为1.0 。

1为第二位第三位，值为（2+3）/2=2.5。

2为第四位第五位，值为（4+5）/2 = 4.5。

4为最后一位（第六位）,值为6.0

相关性与协方差

corr()：相关性

cov()：协方差

corrwith()：相关性（用于不同对象）

Series对象：

ser1.corr(ser2)

ser1.cov(ser2)

DataFrame对象：

frame.corr()

frame.cov()

Series与DataFrame对象：

frame.corrwith(ser)

frame.corrwith(frame1)

NaN数据：

NaN数据其实也是就我们平时中的None值。在数组中也会存在None值。在这里说说常用操作

None、np.NaN、pd.NaT 都表示为空。

dorpna() 或 notnull()：用于判断是否为空，如果NaN则不显示出来，

在使用dorpna()时，注意DataFrame对象，当一行中有一个NaN时，都会视为空。其中有个how参数，将其指定为'all‘时，就只有一行中全部为NaN才不显示。

为NaN值填充元素则用fillna()函数。它可以指定全部，也可以指定部分。

猜你喜欢

转载自blog.csdn.net/fm345689/article/details/88920356

python pandas随笔（通用操作）

python pandas随笔（DataFrame操作）

python pandas随笔（Series操作）

Python通用序列操作

Python——通用序列操作

python列表的通用操作

python pandas随笔（等级索引与分级）

Python的pandas简单操作

python pandas 基本操作

Python pandas DataFrame操作

python pandas操作

python pandas 操作集锦

python爬虫---pandas的操作

【python pandas excel操作】

python pandas随笔（pandas数据结构简介）

python随笔3(操作列表)

Python随笔之文件操作

Python脚本随笔-文件操作

Python 可变序列通用操作

Python之通用序列操作

Python 操作 Oracle 通用代码

Python 操作 MySQL 通用代码

pandas 常用操作整理 - Python

pandas 文件读写操作 - Python

python pandas操作excel表

python--pandas基本操作

Python-Pandas简单操作

[python][pandas]DataFrame的基本操作

python之pandas入门操作

pandas-python基础操作

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)