数据分析01_NumPy常用操作

去年陆续写了pandas的数据清洗的几篇博文,想将python数据分析的完整的笔记整理并发布,因为项目忙一直没时间整理剩余笔记,现在利用年前这段时间将数据分析系列补充完整,这几天会陆续将numpy,scipy和pandas没有完善的整理好,2020新一年共同加油!
之前几篇有兴趣可以回顾一下
《Python数据分析05_Pandas数据清洗、转换和面元划分》
《Python数据分析06_Pandas数据归整:聚合和重塑》
《Python数据分析07_matplotlib绘图和可视化》

一、基础

np.array()
type()
data.dtype
data.shape
data.reshape(())

np.ones(shape, dtype=None, order='C')
np.ones((10,30,450),dtype = "float")

np.zeros(shape, dtype=float, order='C')
np.zeros((10,30,450),dtype = "float")

np.full(shape, fill_value, dtype=None, order='C')
np.dull((12,),fill_value = 1024)

np.eye(N, M=None, k=0, dtype=float)
对角线为1其他的位置为0

np.linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
np.arange([start, ]stop, [step, ]dtype=None)
np.random.randint(low, high=None, size=None, dtype='l')

np.random.randn(d0, d1, ..., dn)  标准正太分布

np.random.normal(loc=0.0, scale=1.0, size=None)

np.random.random(size=None) 生成01的随机数,左闭右开
np.random.random(size = 10)

np.random.randint(0,20,size =(2,3))生成0-20随机整数,两行三列的二维数组

4个属性

data.ndim  维度
data.shape 形状
data.size  长度
data.dtype 元素类型

普通

nd[2,2] = 250 根据索引修改数据
切片:用冒号,两个冒号跟的数据是 取值的步幅
数据反转:
nd1 = np.random.randint(0,100,size = 11)
nd1[::-1]

变形 reshape
级联:就是两个ndarray的数据合到一起 np.concatenate()
需要注意的点:
(1)级联的参数是列表:一定要加中括号或小括号
(2)维度必须相同
(3)形状相符
【重点】级联的方向默认是shape,这个tuple的第一个值所代表的维度方向
可通过axis参数改变级联的方向,
行上面进行级联的时候(axis = 0), 列是必须相同的
列上面进行级联的时候(axis = 1), h行是必须相同的
np.hstack()
np.vstack()

切分:

np.splite()
np.vsplit()
np.hsplit()
副本
data.copy()

聚合

np.prod()乘法
np.power()幂运算

data.argmin()最小值索引
data.argmax()最大值索引

矩阵

data.add()
data.substract()
data.multiply()
data.divide()
np.dot()矩阵乘积

排序

np.sort()
ndarray.sort()
部分排序
np.partition(nd, kth = 10) 就是把前kth个数字 排在前面

NumPy 官网 http://www.numpy.org/
NumPy 源代码:https://github.com/numpy/numpy
SciPy 官网:https://www.scipy.org/
SciPy 源代码:https://github.com/scipy/scipy
Matplotlib 官网:https://matplotlib.org/
Matplotlib 源代码:https://github.com/matplotlib/matplotlib
更多内容可访问:https://www.runoob.com/numpy/numpy-tutorial.html

发布了388 篇原创文章 · 获赞 71 · 访问量 12万+

猜你喜欢

转载自blog.csdn.net/ZZQHELLO2018/article/details/103937074