Python数据分析及可视化(二)数据结构与Python扩展库

一.字典

1.概述

字典是一种key-value的映射对,其中key必须是不可变类型,且字典中元素是无序的,字典用{}标识

2.创建

{key:value...} 或 dict()序列

ps1: 创建字典时,可以通过{}.fromkeys((key_tuple), 默认值)来指定默认值

ps2:可利用zip函数将两个序列的元素对应打包生成字典

3.基本操作

成员判断:in

删除指定键值对:del 字典名[key]

4.函数

dict()、lec()、hash()

keys()、values()分别返回字典的所有key和所有value

5.遍历

for k, v in dict.items():...

6.其他

clear()、update、get()等

二.集合

1.概述

set(),它是一个无序不重复元素的组合,分为可变集合set和不可变集合frozenset

2.操作

比较操作:in、not in、==、!=、<、<=、>、>=

关系运算:&、|、-、^

内建函数....略

三.SciPy中的数据结构

1.概述

ndarray(N维数组)

Series(变长字典)

DataFrame(数据框)

2.三个SciPy库

a.Numpy

有强大的ndarray对象和ufunc函数,适合线性代数和随机数处理等科学计算

b.Matplotlib

基于Numpy,是一个二维绘图库,常用模块pyplot提供了类似于MATLAB的接口

c.pandas

基于Scipy和Numpy,提供了高效的Series和DataFrame数据结构,有高效的数据集切片功能

四.ndarray

1.概述

ndarray是NumPy的基本数据结构,所有元素都是同一类型,拥有丰富的函数

2.基本属性

ndarray.ndim秩

ndarray.shape维度

ndarray.size元素总数

ndarray.dtype元素类型

ndarray.itemsize元素字节大小

3.创建

方法:array、arange、random、linspace、ones、zeros、fromfunction

import numpy as np
aArray = np.array([1,2,3])
bArray = np.array([(1,2,3),(4,5,6)])
np.arange(1,5,0.5)
np.random.random((2,2))
np.linspace(1,2,10,endpoint=False)

4.操作

索引、切片、遍历、reshape、resize、拼接vstack、bstack

支持基本运算符:/>+-*

5.应用——线性代数

dot:矩阵内积

linalg.det行列式

linalg.inv逆矩阵

linalg.solve多元一次方程组求根

linalg.elg求特征值和特征向量

五.变长字典Series

1.概述

字典是一种无序的数据结构,key和value之间不独立,而Series是一个定长有序的字典,它的index和value之间是独立的;类似于一维数组的对象,由数据和索引组成

2.

猜你喜欢

转载自www.cnblogs.com/laideng/p/11440487.html