一、生成器的概念综述
一个带有 yield 的函数就是一个 generator,它和普通函数不同,生成一个 generator 看起来像函数调用,但不会执行任何函数代码,直到对其调用 next()(在 for 循环中会自动调用 next())才开始执行。虽然执行流程仍按函数的流程执行,但每执行到一个 yield 语句就会中断,并返回一个迭代值,下次执行时从 yield 的下一个语句继续执行。看起来就好像一个函数在正常执行的过程中被 yield 中断了数次,每次中断都会通过 yield 返回当前的迭代值。
yield 的好处是显而易见的,把一个函数改写为一个 generator 就获得了迭代能力,比起用类的实例保存状态来计算下一个 next() 的值,不仅代码简洁,而且执行流程异常清晰。
廖雪峰大神写的yield的文章
https://www.ibm.com/developerworks/cn/opensource/os-cn-python-yield/
二、经典案例,生产者消费者模型
了解该模型,需要知道两个函数的调用过程,通过debug模式逐步执行:
1.
consumer.send(None) data = yield producer = produce(consumer) 进入for循环三句话;
执行produce打印语句; consumer.send(data) data = yield(第二次到达,此时yield带来了data的数据并赋值给data变量)
执行consume打印语句; data = yield(第三次到达) yield 进入for循环三句话;
yield 执行 print('现在执行yield之后的函数') 这句话。
执行produce打印语句;开始循环。
由此可知:每个函数在被调用过程中,到达yield关键词后,立马在yield这地方停止,并跳出该函数,进行继续进行其它代码的执行;当该函数再次被调用时候,从yield停止的地方开始执行函数后面的代码。
import random
def get_data():
"""返回0到9之间的3个随机数"""
return random.sample(range(10), 3)
def consume():
"""显示每次传入的整数列表的动态平均值"""
running_sum = 0
data_items_seen = 0
while True:
data = yield
data_items_seen += len(data)
running_sum += sum(data)
print('The running average is {}'.format(running_sum / float(data_items_seen)))
def produce(consumer):
"""产生序列集合,传递给消费函数(consumer)"""
while True:
data = get_data()
print('Produced {}'.format(data))
consumer.send(data)
yield
if __name__ == '__main__':
consumer = consume()
consumer.send(None)
producer = produce(consumer)
for _ in range(10):
print('Producing...')
next(producer)