学习python数据分析与挖掘实战

学习数据分析,这本书以大数据作为研究的对象,强调的是对象的可扩展和普适,开篇先简单介绍了一下相关的知识以及运行环境的搭建,我根据引导,使用windows进行学习然后再用虚拟机进行相关程序的linux学习。我使用了anaconda3.7作为运行的环境,同时使用pycharm作为IDE。虽然这本书说明了自己的运行环境是python2.6的,但是我尝试用2.6来运行时候发现很多也不通。所以决定还是学习2.6,不可以运行但是程序没啥问题。后人也可以学习一下。介绍的一些相关知识比较无关痛痒,这本书的精华我认为在于他的实战部分,有很多种典例可供使用,几乎都是调用的库,非常的简洁,我认为也是编程的 人员所追求的用最少的代码来进行功能实现。
首先,从餐饮业为引,说明在数据挖掘中的流程。首先是数据清洗,总有一些超出常规的值,对于该小样本的也很完整的数据,其采用绘制箱线图的方式对数据的分布进行直观的异常值观察。其次是对数据进行分析,该案例使用的是类别之间的相关性分析,即对点相同菜做一个预测。最后提到了一些常用的工具箱的应用。

猜你喜欢

转载自blog.csdn.net/weixin_42320441/article/details/81662930