介绍几个Python中重要的库

目录

Numpy

Pandas

MatplotLib

Ipython

Scipy

Seaborn

Sockit-Learn

Statsmodels

Keras

Tensorflow


Numpy

Numpy(Numerical Python)是Python科学计算的基础包

具有以下功能:

  • 快速高效的多维数组对象ndarray
  • 用于对数组执行元素级别的计算以及直接对数组执行数学运算的函数
  • 线性代数运算,傅立叶变换,以及随机数生成
  • 用于将C,C++,Fortran代码集成到Python的工具
  • 作为在算法之间传递数据的容器

Pandas

Pandas(Python Data Analysis Library)是基于Numpy 的工具,该工具是为了解决数据分析任务而创建的。

Pandas 提供了大量能使我们快速便捷地处理数据的函数和方法。

Pandas 兼具Numpy 高性能的数组计算功能以及电子表格和关系型数据库的灵活的数据处理功能。它能提供复杂精细的索引功能,以便能更便捷的完成重塑,切片,和切块,聚合以及选取子集的功能。

MatplotLib

Matplotlib 是用于绘制数据图表的Python库。

它是一个二维的绘图库,通过Matplotlib,开发者可以仅需要几行代码,便可生成绘图,直方图,条形图,散点图等。

Ipython

Ipython 是增强版的Python Shell,目的是提高编写,测试,调试Python代码的数据。

它主要用于交互式数据处理和利用Matplotlib 对数据进行可视化处理。

Ipython notebook目前已经整合为 Jupyter notebook

Scipy

Scipy是一组专门解决科学运算中各种标准问题域包的集合

主要包括:

  • scipy.integrate 数值积分和微分方程求解器
  • scipy.linalg 扩展了由numpy.linalg 提供的线性代数例程和矩阵分解功能
  • scipy.optimize 函数优化器
  • scipy.signal 信号处理工具
  • scipy.sparse 稀疏矩阵和稀疏线性矩阵求解器
  • scipy.special SPECFUN的包装器
  • scipy.stats 标准连续和离散概率分布,各种统计校验方法,以及更好的描述统计方法
  • scipy.weave 利用内联C++代码加速数组计算的工具

Numpy 和Scipy 的有机集合可以替代Matlab 的计算功能

Seaborn

统计图形库,seaborn 简化了很多常用可视化类型的生成。

导入seaborn会修改默认的matplotlib 配色方案和绘图样式,可以提高图表的可读性和美观性。

Sockit-Learn

机器学习相关的库

主要包含以下子模块:

  • 分类:SVM,最近邻,随机森林,逻辑回归等
  • 回归:Lasso,岭回归等
  • 聚类:K-means,谱聚类等
  • 降维:PCA,特征选择,矩阵分解等
  • 模型选择:网格搜索,交叉验证,指标矩阵
  • 预处理:特征提取,正态化

Statsmodels

与scikit-learn 相比,statsmodels 包含经典的统计学,经济学算法。

它所包含的模型如下:

  • 回归模型
  • 方差分析
  • 时间序列分析
  • 非参数方法
  • 统计模型结果可视化

statsmodels 更注重统计推理,相反,scikit-learn更专注于预测

Keras

人工神经网络模型

Tensorflow

Tensorflow 是Google 开发的一个机器学习的框架。

Flow是流的意思,机器学习就是对数据的处理,Tensor的是“张量”的意思,那TensorFlow就是”张量流“。

参考:

《利用Python进行数据分析》

猜你喜欢

转载自blog.csdn.net/u014209205/article/details/102478526