python学习：pandas库之DataFrame官方文档简介 - 代码天地

python学习：pandas库之DataFrame官方文档简介

编程语言 2018-07-24 20:09:47 阅读次数: 0

Pandas库是基于Numpy库来创建的，Numpy主要用于矩阵操作，而Pandas主要用于数据处理。

Pandas主要有两种重要的数据结构：Series和DataFrame.

Series: 类似一个一维数组，一个Series对应DataFrame的一列
DataFrame:类似一个二维数组，一个DataFrame由几个Series列构成。

在我们学习任何一种开源框架，必须得学会阅读其官方文档：

http://pandas.pydata.org/pandas-docs/stable/generated/pandas.DataFrame.html

根据官方文档，我们先看其最左边的目录：

我们通过对各子目录的简单介绍，来了解DataFrame如何运用:

英文目录	中文目录	该目录下常用属性/方法
Constructor	构造方法	可以由numpy数组/字典/DataFrame生成
Attributes and underlying data	属性值	index：数据表的行索引 columns：数据表的列索引 shape：数据表的形状 dtypes：数据表值的数据类型
Conversion	转换	astype：转换数据类型
Indexing, iteration	索引/迭代	iloc/loc/iteritems/iterrows/isin
Binary operator functions	二元运算符函数	add/sub/mul/div：加减乘除，元素级计算 dot：点乘 df1.combine_first(df2)：用df2的值填充df1的空值
Function application, GroupBy & Window	apply方法/分组/	apply：在数据表中沿着行/列方向调用某方法 groupby：通过mapping/方法/标签/标签集进行分组，返回一个GroupBy对象。GroupBy对象可进行统计学各值计算或调用其apply/agg方法+D15。 agg/aggregate：聚合函数
Computations / Descriptive Stats	计算/描述性统计	describe：输出数据表各列统计值-中位值/方差等 /max/mean/var/corr
Reindexing / Selection/ Label manipulation	重新索引/选择数据/通过标签操作	reindex：重命名行/列 rename：可以通过字典的方法重命名行/列 /reset_index/ head：选择前N行数据，默认前5行 tail：选择最后N行数据，默认后5行 drop_duplicates：返回丢弃了重复值的dataframe duplicated：根据是否是重复值返回布尔值Series drop
Missing data handling	缺失值处理	dropna/fillna/replace
Reshaping/ sorting,/ transposing	改变数组形状/ 排序/转换	sort_values：按表中内容值大小排序， sort_index：按行/列的值大小排序 T：矩阵转置 pivot_table：数据透视表
Combining / joining / merging	合并/连接	append：在数据表末尾添加行数据 /join/ merge：类似SQL的连接，内连接/外连接
Time series-related	时间序列
Plotting	绘制图形	plot：通过kind参数绘制不同图形
Serialization / IO / Conversion	读取操作	from_csv/to_csv
Sparse	稀疏矩阵
数据分箱技术Binning：pandas.cut() 数据分组技术GroupBy：GroupBy.get_group(groupname1)--> 得到其中一组类别的dataframe

猜你喜欢

转载自blog.csdn.net/Genius9_9/article/details/81168652

python学习：pandas库之DataFrame官方文档简介

【Python学习笔记】Pandas库之DataFrame

pandas.DataFrame官方文档链接

Pandas库之DataFrame

Pandas 库之 DataFrame

Python之pandas的DataFrame

Python Pandas之DataFrame

pandas学习之DataFrame

Pandas之DataFrame学习总结

Pandas 之 DataFrame 学习总结

官方练习 Pandas 数据结构简介 Series VS DataFrame

Python学习之pandas库

学习 Python 之 Pandas库

《Python数据分析实战》4 pandas库简介 Series DataFrame

Python数据处理库pandas中的DataFrame数据结构简介

pandas库介绍之DataFrame基操

pandas库之DataFrame基本操作

Python3--我的代码库之Pandas库之DataFrame（二）

Python3--我的代码库之Pandas库之DataFrame（一）

Python中Pandas库 Dataframe的基本操作

Python数据分析库pandas ------ DataFrame

python的pandas库快速入门(Series、DataFrame)

Python数据分析之Pandas（1）——Pandas官方文档解读：一篇文章 Pandas 快速上手

Python pandas模块之Dataframe操作汇集

python pandas 之 Dataframe 数据结构

Python：pandas之DataFrame常用操作

Python之Pandas中Series、DataFrame实践

pandas学习笔记之Dataframe索引

Py之pandas：dataframe学习【转载】

【Python3.72官方文档】——Python 简介

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)