python机器学习入门之pandas的使用（超详细，必看） - 代码天地

python机器学习入门之pandas的使用（超详细，必看）

企业开发 2022-09-14 03:28:29 阅读次数: 0

pandas是基于numpy的一种工具同样用于数据分析

pandas主要处理以下三种数据结构

1：series 一维数组接近python中的list

2：DataFrame 二维数据结构其可以理解为series的容器其内部的每项元素可以看成一个series 在机器学习中经常用到

3：panel 三维数组可以理解为DataFrame的容器

1：创建一个series对象

import pandas as pd
s=pd.Series([1,3,5,6,8,9])
print(s)

可以通过赋值操作直接修改Series对象成员的值

s[1]=5

根据条件表达式筛选数据

s=pd.Series([1,3,5,6])
b=pd.Series([4,5,6,6])
print(s[s>2])

通过drop函数可以删除对象成员

2：DateFrame是一个表格型的数据结构包括行索引和列索引

import pandas as pd
dict1={'col1':[2,4,5,3],'col2':['a','b','c','d']}
df=pd.DataFrame(dict1)
print(df)

访问DataFrame有多种方法可以通过下标和索引等等

import pandas as pd
ser=pd.Series(np.arange(4),index=['a','b','c','d'])
data=pd.DataFrame(np.arange(16).reshape(4,4),index=['AJ','BJ','CJ','DJ'],columns=['q','r','s','t'])
print("ser['c]:",ser['c'])
print("ser 2:",ser[2])
print("date q:",data['q'])
print("data q t:",data[['q','t']])

loc方法则是通过索引名抽取数据 iloc则是通过下标值抽取数据

3：数据对齐

pandas有个很好的功能是对齐不同索引的数据如两个数据对象相加如果索引不同则结果的索引是这两个索引的并集

3.2：缺失数据的处理

NA值会带入后续的操作导致出错所以dropna方法可以预先过滤缺失数据

会默认丢失所以含有缺失值的行如果想对列进行过滤则把axis=1即可

参数how可以根据行或者列中的NA数量来决定是否删除行或列常用的有all或者any

from numpy import nan as NA
data=pd.Series([1,NA,3.5,NA,7])
data.dropna()

3.3：notnull函数可以判断空值下面的代码可以过滤空值

s1=pd.Series(['one','two','thress',NA,None])
print(s1[s1.notnull()])

3.4：填充缺失数据 如果不想删除有缺失值的行和列可以用fillna方法填充数据

s1=pd.Series(['one','two','thress',NA,None])
print(s1[s1.notnull()])
print(s1.fillna('ljl'))

猜你喜欢

转载自blog.csdn.net/jiebaoshayebuhui/article/details/126745898

python机器学习入门之pandas的使用（超详细，必看）

python机器学习入门之opencv的使用（超详细，必看）

python机器学习入门之matplotlib的使用（超详细，必看）

python机器学习入门之numpy的用法（超详细，必看）

Python 机器学习入门之pandas的使用

python机器学习入门之opencv的安装与环境配置（超详细，避坑必看，包括没代码提示的解决）

JAVA WBE入门之HTML的使用(超详细，必看)附实例和代码

机器学习入门必看

Python 机器学习入门系列之1-pandas的使用，最新Python从入门到精通自学教程，免费分享

Python之Pandas超详细入门教程 -- 第三章 Pandas中DataFrame运算【基础篇】

Python之Pandas超详细入门教程 -- 第二章 Pandas基本数据操作【基础篇】

Python之Pandas超详细入门教程 -- 第一章 Pandas数据结构【基础篇】

Python之Pandas超详细入门教程 -- 第七章 Pandas分组与聚合【进阶篇】

Python之Pandas超详细入门教程 -- 第五章 Pandas缺失值处理【进阶篇】

Python之Pandas超详细入门教程 -- 第四章 Pandas中文件读取与存储【基础篇】

Python机器学习基础之Pandas库的使用

机器学习入门------pandas

数据库从入门到精通合集（超详细，学习数据库必看）

Python之Pandas超详细入门教程 -- 第六章 Pandas数据离散化与合并【进阶篇】

零基础入门到精通：Python大数据与机器学习之Pandas-数据操作

机器学习之Pandas

2023Python学习路线图新版超详细，小白必看！建议收藏

【机器学习】基础之线性代数(超详细总结)

机器学习之python入门指南（四）函数的使用

机器学习入门三剑客之Pandas

c++ set用法入门必看超详细

c++ vector用法入门必看超详细

Python学习 | Pandas入门

超详细很实用入门必看：Java，C与Python三种大热编程语言比较分析与建议

必看！！！python列表（增删改查）,超详细讲解！！

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)