1.python与数据分析
(1)特点:简洁、开发效率高、运行速度慢、胶水特性(可调用面向过程语言)
(2)数据分析库:numpy(数据结构基础ndarray)、scipy(强大的科学计算方法:矩阵、信号、数理分析等)、matplotlib(丰富的可视化套件)、pandas(基础数据分析套件)、scikit-learn(分析算法库)、keras(人工神经网络)......
2.python环境搭建
(1)www.continuum.io/下载anaconda
(2)安装科学计算工具anaconda
3.numpy
(1)numpy学习官网:www.numpy.org
(2)提供功能: ndarray、多维操作、线性代数
(3)ndarray说明:
1)仅仅存放一种类型数据
lst = [[1,3,5],[2,4,6]]
# bool,int/8/16/32/64/128,uint8/16/32/64/128,float16/32/64/128,comlex32/64/128
np_list = np.array(lst, dtype=float)
2)ndarray内部属性
print(np_list.shape) # 数组形状
print(np_list.ndim) # 数组维数
print(np_list.itemsize) # 每个元素所占字节
print(np_list.size) # 数组元素个数
3)常用数组
print(np.zeros([2,4])) # 创建2x4数组并初始化为0
print(np.ones([2,4])) # 创建2x4数组并初始化为1
print(np.random.rand(2,4)) # 创建2x4数组并初始化为0-1之间的浮点数
print(np.random.randint(1,10,3)) # 输出3个1-10之间的随机整数
print(np.random.randn(2,4)) # 生成2x4列数组并初始化为正太分布随机数
print(np.random.choice([10,20,30])) # 随机生成给定迭代器中数值的随机数
print(np.random.beta(1,10,100)) # 生成1-10当中符合β分布的100个随机数
# 还有一些其他的数组
4)数组操作