python高级数据分析基础知识:pandas及其基本应用总结整理

二、numpy及其基本应用总结整理
Series篇
2.1 创建Series数据
2.1.1 Series数据的基本概念、结构与新变量的创建
2.1.2 python使用字典数据生成Series数组并用isnull/notnull方法检测是否为空
2.1.3 通过name属性给Series对象和索引命名
2.2 读取Series数据
2.2.1 python中获取Series数组中的值(单个元素或者切片元素)
2.3 Series数组的操作
2.3.1 使用data.value_counts()方法对Series数组中的重复元素进行统计
2.3.2 python用in关键词判断某个数是否存在于Series的索引(index)中
2.3.3 对Series数组进行一元及二元数学运算
DataFrame篇
2.4 创建DataFrame
2.4.1 创建DataFrame:python中用字典初始化DF数据帧
2.4.2 python中使用columns参数指定DataFrame数据帧的列(字段)顺序
2.4.3 python使用index参数设置每一行的索引名
2.5 DataFrame的增删改查
2.5.1 python中用columns参数获取DataFrame各列的表头名
2.5.2 python中DataFrame的“增删改查”之“查”:用columns参数获取DF数据中的某一列数据
2.5.3 DataFrame的“增删改查”之“查”:用iloc()/loc()方法获取DF数据中的某一行数据
2.5.4 DataFrame的“增删改查”之“查”:用index和column参数定位的组合查询具体某个坐标的元素
2.5.5 python中DataFrame的切片:用.copy获取DF数据的某一列数据副本
2.5.6 DataFrame数据帧的多级索引
2.5.7 DataFrame的“增删改查”之“改”:修改DF数据帧中的某一列数据
2.5.8 DataFrame的“增删改查”之“删”:用del指令删除DF数据中的某一列数据
2.5.9 DataFrame的“增删改查”之“删”:用drop()方法删除DF数据中的某一行数据

2.6 DataFrame的数据操作
2.6.1 redindex()方法:对DataFrame数据帧的行进行重新排列
2.6.2 用dropna()/fillna()来清洗(删除或者填充)DataFrame中的Na数据
2.6.3 python中DataFrame数据帧的筛选:使用布尔表达式返回是否引用序列
2.6.4 python中用gourpby()方法DataFrame数据帧进行分组
2.6.5 DataFrame中的groupby分组对象是个什么东东
2.6.6 .sort_index()方法对DataFrame数据帧进行排序
2.6.7 .sort_values()方法对DataFrame数据帧进行排序
2.6.8 python中DataFrame数据帧的统计方法
2.6.9 python中用merge方法对两个DataFrame进行合并

2.7 Pandas的文件操作
2.7.1 python用pd.read_csv()方法来读取csv文件
2.7.2 python中用.to_csv(“filename”)方法将DataFrame数据帧存储为.csv文件
2.7.3 python用pandas库读取excel中的文件存入DataFrame数据帧中
2.7.4 pd.read_csv方法读csv文件时使用index_col参数设置第一列作为index

2.8 DataFrame应用实例
2.8.1 全脑拆记单词小工具:英文单词伪意生成器项目
2.8.2 用pandas在海量数据中找出最热的50本书和最热的10个标签

发布了126 篇原创文章 · 获赞 5 · 访问量 3432

猜你喜欢

转载自blog.csdn.net/weixin_41855010/article/details/104348634