python 数据分析工具

参考书籍:python 数据分析与挖掘实践

如果安装的是anaconda 发行版,已自带Numpy. Scipy, Matplotlib, Pandash, Sckit-learn, Kreas 和Gensim 等,下面简单介绍下这边扩展包的,便于使用相关功能时快速查询。

Numpy :

python 没有提供数组功能,Numpy提供了真正的数据功能,以及对数据进行快速处理的函数,很多库将依赖于它!

Scipy:

依赖于numpy, 提供矩阵支撑,让其有类似Malab的功能,最优化,积分,拟合,信号图像处理,常微分求解和其他科学工程常用的计算。

Matplotlib:

强大的数据可视化工具,作图库。主要用于二位绘图和简单的三维绘图。

Pandas:

强大,灵活的数据分析和探索工具。支持类似于SQL的数据增删查改,丰富的数据处理函数,支持时间序列功能,支持灵活处理缺失数据。基本结构为DataFrame和Series。

SatasModels:

pandas着眼于数据的读取、处理和探索,而StatsModels则更注重用于数据的统计建模分析,类似于R。并支持与Pandas进行数据交互,因此,组合为强大的数据挖掘组合,

Scikit-learn :

支持回归、分类、聚类等强大的机器学习库。包括数据预处理、分类、回归、聚类、预测和模型分析等。依赖于Numpy,Scipy和Matplotlib。

https://blog.csdn.net/wella_liu/article/details/102860988

 Kreas:

深度学习库。弥补scikit-learn所没有包含的神经网络。功能相对强大,但原理又相对简单的模型,在语言处理、图像识别等领域有着重要的作用。

Windows安装较为麻烦,可用GPU加速预算

Gensim:

文本主题模式下的库,可用于文本挖掘。如文本相似度计算,LDA,Word2Vec等,建议在Linux环境下运行。

可架构虚拟机进行操作。

发布了19 篇原创文章 · 获赞 1 · 访问量 2183

猜你喜欢

转载自blog.csdn.net/wella_liu/article/details/102857525