《python数据分析与挖掘实战》第二章 python数据分析简介

第二章 python数据分析简介

2.1搭建python开发平台

(1)Windows
在Windows系统中安装python,直接到官网下载相应的msi安装包安装即可。
(2) Anaconda
安装python核心程序只是第一步,为了实现更丰富的科学计算功能,还需要安装一些第三方的扩展库,这样就有点麻烦了,尤其在Windows系统中安装还会出现各种错误。
有人专门将科学计算要用的库打包起来,以发行版(Anaconda)的形式供用户使用。

2.2 python入门

只回顾一下函数式编程
在python中,函数式编程主要由几个函数的使用构成:lambda()、map()、reduce()、filter()。
lambda()
说明:匿名函数
作用:简化代码

f = lambda x : x+2  #定义函数f(x) = x+2

map()
说明:假设有一个列表a = [1,2,3],要给列表中的每一个元素都加2得到一个新列表,除了可以用b = [i+2 for i in a],还可以用map()
作用:map()将函数逐一用到可迭代对象中的每个元素上
函数语法:map(f(x),Itera),它有两个参数,第一个参数为某个函数,第二个为可迭代对象

b = map(lambda x: x+2, a)
b = list(b)     # 在python 3.x 中需要这一步,map()函数仅仅创建一个待运行的命令容器
             (list tuple dictionary set),只有其他函数调用它的时候才返回结果。

reduce()
说明:递归运算
函数语法:reduce(function, iterable[, initializer])
function – 函数,有两个参数
iterable – 可迭代对象
initializer – 可选,初始参数

>>>def add(x, y) :            # 两数相加
       return x + y
>>> reduce(add, [1,2,3,4,5])   # 计算列表和:1+2+3+4+5
15

filter()
说明:过滤器
函数用法:filter(function, iterable)
function – 判断函数。
iterable – 可迭代对象。

b = filter(lambda x: x > 5 and x < 8, range(10))
b = list(b)      #在python 3.x 中需要这一步

注意:我们使用map()、reduce()、filter(),最终目的是兼顾简洁和效率,因为map()、reduce()、filter()的循环速度比Python内置的for或while循环要快的多。

2.3 python数据分析工具

在这里插入图片描述
上面表中扩展库的参考链接:
Numpy http://www.numpy.org/
Scipy http://www.scipy.org/
Matplotlib http://www.matplotlib.org/
Pandas 官方文档: http://pandas.pydata.org/pandas-docs/stable
中文API文档:https://www.jianshu.com/p/a77b0bc736f2
StatsModels http://statsmodels.sourceforge.net/stable/index.html
Scikit-Learn http://scikit-learn.org/
Keras http://radimrehurek.com/gensim/
Gensim http://radimrehurek.com/gensim/

发布了43 篇原创文章 · 获赞 46 · 访问量 4513

猜你喜欢

转载自blog.csdn.net/S_123789/article/details/95775744