reduce和map的区别

1,reduce

上代码:

from functools import reduce

sum1 = reduce(lambda x, y: x + y, range(1, 5))
print(sum1)  # 10

输出结果:

10

结论:

reduce返回的是函数经过执行运算后的结果,reduce累计运算,适合做大数据的运算,前两个元素作用得到结果后,继续和下一个元素运算

2.map

上代码:

sum2 = map(lambda y: y ** 2, range(1, 5))
print(type(sum2))  # <class 'map'>
print(sum2)  # <map object at 0x7f809ce4c1d0>
for i in sum2:
    print(i)    # 1,4,9,16

输出结果:

<class 'map'>
<map object at 0x7fb741db00f0>
1
4
9
16

结论:map返回的是个集合,函数依次作用到每一个元素,每个元素都会被函数单独作用一次。

3.综上所述:

    map和reduce函数均是接受两个参数,第一个参数,均是一个函数,可以是匿名函数,也可以是普通的函数,第二个参数是一个可迭代的序列(列表 或元组)

    map函数的第一个参数是函数,函数的参数可以是1个或者多个,而reduce只能接受2个参数。

    map()是将传入的函数依次作用到序列的每个元素,每个元素都是独自被函数“作用”一次 。
reduce()是将传人的函数作用在序列的第一个元素得到结果后,把这个结果继续与下一个元素作用(累积计算)。


4.飞跃拓展:

    reduce()函数在库functools里,如果要使用它,要从这个库里导入。reduce函数与map函数有不一样地方,map操作是并行操作,reduce函数是把多个参数合并的操作,也就是从多个条件简化的结果,在计算机的算法里,大多数情况下,就是为了简单化。比如识别图像是否是一只猫,那么就是从众多的像素里提炼出来一个判断:是或否。可能是几百万个像素,就只出来一个结果。在google大规模集群里,就是利用这个思想,把前面并行处理的操作叫做map,并行处理之后的结果,就需要简化,归类,把这个简化和归类的过程就叫做reduce。由于reduce只能在一台主机上操作,并不能分布式地处理,但是reduce处理的是map结果,那么意味着这些结果已经非常简单,数据量大大减小,处理起来就非常快。因此可以把map,reduce过程叫做分析归纳的过程。





猜你喜欢

转载自blog.csdn.net/liangkaiping0525/article/details/80862540