Python数据分析及可视化（二）数据结构与Python扩展库

一.字典

1.概述

字典是一种key-value的映射对，其中key必须是不可变类型，且字典中元素是无序的，字典用{}标识

2.创建

{key:value...} 或 dict()序列

ps1：创建字典时，可以通过{}.fromkeys((key_tuple), 默认值)来指定默认值

ps2：可利用zip函数将两个序列的元素对应打包生成字典

3.基本操作

成员判断：in

删除指定键值对：del 字典名[key]

4.函数

dict()、lec()、hash()

keys()、values()分别返回字典的所有key和所有value

5.遍历

for k, v in dict.items():...

6.其他

clear()、update、get()等

二.集合

1.概述

set()，它是一个无序不重复元素的组合，分为可变集合set和不可变集合frozenset

2.操作

比较操作：in、not in、==、!=、<、<=、>、>=

关系运算：&、|、-、^

内建函数....略

三.SciPy中的数据结构

1.概述

ndarray(N维数组)

Series（变长字典）

DataFrame(数据框)

2.三个SciPy库

a.Numpy

有强大的ndarray对象和ufunc函数，适合线性代数和随机数处理等科学计算

b.Matplotlib

基于Numpy，是一个二维绘图库，常用模块pyplot提供了类似于MATLAB的接口

c.pandas

基于Scipy和Numpy，提供了高效的Series和DataFrame数据结构，有高效的数据集切片功能

四.ndarray

1.概述

ndarray是NumPy的基本数据结构，所有元素都是同一类型，拥有丰富的函数

2.基本属性

ndarray.ndim秩

ndarray.shape维度

ndarray.size元素总数

ndarray.dtype元素类型

ndarray.itemsize元素字节大小

3.创建

方法：array、arange、random、linspace、ones、zeros、fromfunction

import numpy as np
aArray = np.array([1,2,3])
bArray = np.array([(1,2,3),(4,5,6)])
np.arange(1,5,0.5)
np.random.random((2,2))
np.linspace(1,2,10,endpoint=False)

4.操作

索引、切片、遍历、reshape、resize、拼接vstack、bstack

支持基本运算符：/>+-*

5.应用——线性代数

dot：矩阵内积

linalg.det行列式

linalg.inv逆矩阵

linalg.solve多元一次方程组求根

linalg.elg求特征值和特征向量

五.变长字典Series

1.概述

字典是一种无序的数据结构，key和value之间不独立，而Series是一个定长有序的字典，它的index和value之间是独立的；类似于一维数组的对象，由数据和索引组成

Python数据分析及可视化（二）数据结构与Python扩展库

猜你喜欢