numpy,pandas学习笔记

numpy & Pandas

ndarray

ndarray:存放相同类型元素的多维数组,每个元素在内存中有相同存储大小的区域。
在这里插入图片描述

array创建方法

	np.array[1,2,3,4,5,6]
	np.arange(6)       np.arange(2,8, step=2,dtype = np.int64) #可限定范围和步长,指定dtype
	np.ones((2,2))    #全为1的矩阵
	np.zeros((2,2))   #全为0的矩阵
	np.eye(3)         #n维单位矩阵
	np.random.rand(size)  #[0,1)的随机值
	np.random.randn(size) #返回值具有标准正态分布
	np.random.randint(low,high,size) #[low,high)的随机整数组成的矩阵
	x.reshape(3,2)	 #变更shape
	np.save('filename',x)
	np.load('filename.npy')

ndarray访问和修改

在这里插入图片描述
在这里插入图片描述

ndarray删除和插入

在这里插入图片描述
在这里插入图片描述

ndarray切片

在这里插入图片描述

ndarray过滤

在这里插入图片描述

ndarray集合运算

在这里插入图片描述

ndarray运算与广播

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Pandas

Series

Series是一个类似于array的一维对象,与array不同的是,Series的每一个元素都可以给它分配索引标签

创建Series

在这里插入图片描述

Serie访问、修改和删除

loc:通过index索引访问
iloc:通过行号索引访问
loc是指location的意思,iloc中的i是指integer
在这里插入图片描述

DataFrame

创建和保存dataframe

在这里插入图片描述

读取csv为dataframe并查看

在这里插入图片描述
.head()
.describe()
.info()
在这里插入图片描述

访问、修改和删除dataframe

在这里插入图片描述
在这里插入图片描述

缺失值NaN

NaN与任何值做比较计算都是false,甚至和NaN==NaN也是false
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

dataframe分组

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

apply进行批量操作

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
分段制作交叉表
在这里插入图片描述
在这里插入图片描述

pd.concat()

pd.concat(objs, axis=0, join='outer', join_axes=None, ignore_index=False,
       keys=None, levels=None, names=None, verify_integrity=False)

输入的objs需要为dataframe组成的列表

pd.get_dummies()

pandas.get_dummies(data, prefix=None, prefix_sep=’_’, dummy_na=False, columns=None, sparse=False, drop_first=False)

需要制定生成列名的前缀,prefix=

dtype,astype,type

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/wezard95/article/details/104905068
今日推荐