python数据分析——基础技术

1.python与数据分析

(1)特点:简洁、开发效率高、运行速度慢、胶水特性(可调用面向过程语言)

(2)数据分析库:numpy(数据结构基础ndarray)、scipy(强大的科学计算方法:矩阵、信号、数理分析等)、matplotlib(丰富的可视化套件)、pandas(基础数据分析套件)、scikit-learn(分析算法库)、keras(人工神经网络)......

2.python环境搭建

(1)www.continuum.io/下载anaconda

(2)安装科学计算工具anaconda

3.numpy

(1)numpy学习官网:www.numpy.org

(2)提供功能: ndarray、多维操作、线性代数

(3)ndarray说明:

        1)仅仅存放一种类型数据

lst = [[1,3,5],[2,4,6]]

# bool,int/8/16/32/64/128,uint8/16/32/64/128,float16/32/64/128,comlex32/64/128
np_list = np.array(lst, dtype=float)

        2)ndarray内部属性

print(np_list.shape)  # 数组形状
print(np_list.ndim)   # 数组维数
print(np_list.itemsize)  # 每个元素所占字节
print(np_list.size)      # 数组元素个数

        3)常用数组

print(np.zeros([2,4]))  # 创建2x4数组并初始化为0
print(np.ones([2,4]))   # 创建2x4数组并初始化为1
print(np.random.rand(2,4))  # 创建2x4数组并初始化为0-1之间的浮点数
print(np.random.randint(1,10,3))  # 输出3个1-10之间的随机整数
print(np.random.randn(2,4))  # 生成2x4列数组并初始化为正太分布随机数
print(np.random.choice([10,20,30]))  # 随机生成给定迭代器中数值的随机数
print(np.random.beta(1,10,100))  # 生成1-10当中符合β分布的100个随机数

# 还有一些其他的数组

        4)数组操作








猜你喜欢

转载自blog.csdn.net/admin_maxin/article/details/80726004