《利用python进行数据分析》——3.2函数——生成器generator——读书笔记

1. 生成器定义

一边循环一边计算的机制,称为:生成器(generator)

生成器(generator)是构造新的可迭代对象的一种简单方式。

一般的函数执行之后只会返回单个值,而生成器则是以延迟的方式返回一个值序列,

即每返回一个值之后暂停,直到下一个值被请求时再继续。

生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器

2. 为什么要有生成器

python生成器的优点:

(1)延迟计算,一次返回一个结果。生成器不会一次生成所有的结果,而是一边循环一边计算,这对于大数据量处理,是个非常有用的优势。因为在编程的实际应用中,占用内存量是工程师必须考虑的一个问题。

列表所有数据都在内存中,如果有海量数据的话将会非常耗内存。

如:仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。

如果列表元素按照某种算法推算出来,那我们就可以在循环的过程中不断推算出后续的元素,这样就不必创建完整的list,从而节省大量的空间。

简单一句话:我又想要得到庞大的数据,又想让它占用空间少,那就用生成器!

(2)有效提高代码可读性。使用生成器以后,代码行数更少。

3.如何创建生成器

第一种方法很简单,只要把一个列表生成式的[]改成(),就创建了一个generator:

In [189]: gen = (x ** 2 for x in range(100))
In [190]: gen
Out[190]: <generator object <genexpr> at 0x1022ef630>

 创建Lg的区别仅在于最外层的[]()L是一个list,而g是一个generator。

方法二, 如果一个函数中包含yield关键字,那么这个函数就不再是一个普通函数,而是一个generator。调用函数就是创建了一个生成器(generator)对象。要创建一个生成器,只需将函数中的return替换为yeild即可:

def _make_gen():
    for x in range(100):
        yield x ** 2
gen = _make_gen()

生成器表达式也可以取代列表推导式,作为函数参数:

In [191]: sum(x ** 2 for x in range(100))
Out[191]: 328350
In [192]: dict((i, i **2) for i in range(5))
Out[192]: {0: 0, 1: 1, 2: 4, 3: 9, 4: 16}

4. 生成器的工作原理

(1)生成器(generator)能够迭代的关键是它有一个next()方法,

  工作原理就是通过重复调用next()方法,直到捕获一个异常。

(2)带有 yield 的函数不再是一个普通函数,而是一个生成器generator。

  可用next()调用生成器对象来取值。next 两种方式 t.__next__()  |  next(t)。

  可用for 循环获取返回值(每执行一次,取生成器里面一个值)

  (基本上不会用next()来获取下一个返回值,而是直接使用for循环来迭代)。

(3)yield相当于 return 返回一个值,并且记住这个返回的位置,下次迭代时,代码从yield的下一条语句开始执行。

(4).send() 和next()一样,都能让生成器继续往下走一步(下次遇到yield停),但send()能传一个值,这个值作为yield表达式整体的结果

  通过例子来理解下:

In [63]: def yield_test(n):
 (1)...:     print("begin:")
 (2)...:     for i in range(n):
 (3)...:         print('yield_1_i=',i)
 (4)...:         yield call(i)
 (5)...:         print('yield_2_i=',i)
 (6)...:     print("Done")
    ...:
In [64]: def call(i):
 (7)...:     print('call',i)
 (8)...:     return i*2
    ...:
In [65]: for i in yield_test(3):
 (9)...:     print("now:",i)

yield相当于 return 返回一个值,并且记住这个返回的位置,
下次迭代时,代码从yield的下一条语句开始执行。

结果:
begin           (运行9)
yield_1_i=0     (进入第一轮for循环,i=0,运行3)       
call 0          (运行4——7——8,得到0*2=0,返回0)
now 0           (yield相当于return返回一个值,并且记住这个返回的位置,所以运行9)
yield_2_i=0     (下次迭代时,代码从yield的下一条语句开始执行,所以运行5,i不变仍然是0)
yield_1_i=1     (进入第二轮for循环,i=1,运行3)
call 1          (运行4——7——8,得到1*2=2,返回2)
now 2           (yield相当于return返回一个值,并且记住这个返回的位置,所以运行9)
yield_2_i=1     (下次迭代时,代码从yield的下一条语句开始执行,所以运行5,i仍是1)
yield_1_i=2     (进入第三轮for循环,i=2,运行3)
call 2          (运行4——7——8,得到2*2=4,返回4)
now 4           (yield相当于return返回一个值,并且记住这个返回的位置,所以运行9)
yield_2_i=2     (下次迭代时,代码从yield的下一条语句开始执行,所以运行5,i仍是2)
done            (循环结束,运行6)

   

 总结:

什么是生成器?

生成器仅仅保存了一套生成数值的算法,并且没有让这个算法现在就开始执行,而是我什么时候调它,它什么时候开始计算一个新的值,并给你返回。

参考:https://www.cnblogs.com/liangmingshen/p/9706181.html

发布了15 篇原创文章 · 获赞 11 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/baidu_28660921/article/details/104214643