Python数据分析简介

一 数据分析的含义和目标

1、统计分析方法
2、提取有用信息
3、研究、概括、总结
 
二 Python与数据分析
1、Python:Guido van Rossum   1989圣诞假期
2、特点:简洁  开发效率高 运算速度慢 胶水特性
3、数据分析:numpy,scipy,matplotlib,pandas,scikit-learn、keras
4、用于Python科学计算与可视化的扩展模块主要有 NumPy、SciPy、SymPy、matplotlib、Traits、TraitsUI、Chaco、TVTK、Mayavi、VPython、OpenCV
 
三 Python数据分析大家族
numpy:科学计算包,支持N维数组运算、处理大型矩阵、成熟的广播函数库、矢量运算、线性代数、傅里叶变换、随机数生成,并可与C++/Fortran语言无缝结合。树莓派Python v3默认安装就已包含了numpy。
scipy:scipy依赖于numpy,提供了更多的数学工具,包括矩阵运算、线性方程组求解、积分、优化等等。
matplotlib:依赖于numpy模块和tkinter模块,可以绘制多种形式的图形,包括线图、直方图、饼状图、散点图、误差线图等等,图形质量可满足出版要求,是计算结果可视化的重要工具。
pandas:基础数据分析套件
scikit-learn:强大的数据分析建模库
keras:人工神经网络
 
四 Python环境搭建
平台:Windows、Linux、MacOS
科学计算工具:Anaconda
大量科学扩展库安装包下载: http://www.lfd.uci.edu/~gohlke/pythonlibs/
enthought科学计算解决方案: https://www.enthought.com/
 

猜你喜欢

转载自cakin24.iteye.com/blog/2387630