Numpy和Pandas

     NumPy有着种种出色的特性(优化了Python计算过程),其本身则难以独支数据分析这座大厦,这是一方面是由于NumPy几乎仅专注于数组处理,另一方面则是数据分析牵涉到的数据特性众多,需要处理各种表格和混杂数据,远非纯粹的数组(NumPy)方便解决的,而这就是pandas发力的地方。

     Pandas名称来源于panel data(面板数据),从而可见其要处理的数据是多维度的而非单维度.pandas 含有使数据清洗和分析工作变得更快更简单的数据结构与操作工具。经常是和其他工具一起使用,如数值计算工具NumPy和SciPy,分析库statsmodels与scikit-learn,以及数据可视化库matplotlib。

     其中NumPy则是构建pandas的基础,后者大量借鉴了NumPy编码风格。

     如果用做一餐饭来比喻,pandas于处理数据方面的功用则相当于将米洗好,将菜摘好洗好以及切好的过程,至于入锅添油加醋,锅铲捣腾,做成一道菜则是依靠statsmodels、scikit-learn和matplotlib的功能。

猜你喜欢

转载自blog.csdn.net/daxuan1881/article/details/84831304