Python 用于数据分析的库 NumPy、pandas、matplotlib以及scipy
SciPy
是一款方便、易于使用、专为科学和工程设计的Python工具包.它包括统计,优化,整合,线性代数模块,傅里叶变换,信号和图像处理,常微分方程求解器等等.
**NumPy**
几乎仅专注于数组处理
,另一方面则是数据分析牵涉到的数据特性众多,需要处理各种表格和混杂数据,远非纯粹的数组(NumPy)方便解决的,这就需要pandas
pandas 这个名称来源于panel data(面板数据),从而可见其要处理的数据是多维度的而非单维度。pandas 含有使数据清洗和分析工作变得更快更简单的数据结构与操作工具
。经常是和其他工具一起使用,如数值计算工具NumPy
和SciPy
,分析库statsmodels
与scikit-learn
,以及数据可视化库matplotlib
。其中NumPy则是构建pandas的基础,后者大量借鉴了NumPy编码风格