注:一般来讲,yield就是 return 返回一个值,并且记住这个返回的位置,下次迭代就从这个位置后开始。
在通常的for…in…循环中,in后面是一个数组,这个数组就是一个可迭代对象,类似的还有链表,字符串,文件。它可以是list = [1, 2, 3],也可以是mylist = [x*x for x in range(8)]。 它的缺陷是所有数据都在内存中,如果有海量数据的话将会非常耗内存。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访问前面几个元素,那后面绝大多数元素占用的空间都白白浪费了。
所以,如果列表元素可以按照某种算法推算出来,那我们是否可以在循环的过程中不断推算出后续的元素呢?这样就不必创建完整的list,从而节省大量的空间。在Python中,这种一边循环一边计算的机制,称为生成器:generator。
g = (x * x for x in range(10))
for i in g:
print(i)
I、理解yield,第一步需要理解yield和return的区别
print('yield:')
def _testyield():
for i in range(5):
yield i*i
#这里产生生成器对象,跟java对象意思相同
generator = _testyield()
for i in range(5):
print(next(generator))
#-----------------------------------------------------------#
print('return:')
def _return(n):
# 这里res是一个list[],得出的结果是[1,2,3,4,5]
res = [i*i for i in range(n)]
return res
for i in _return(5):
print(i)
上面yield和return生成的结果相同:
但是这里面的区别在于:
return返回的是一个list列表,而yield每次调用只返回一个数值,毫无疑问,使用return空间开销比较大,尤其是操作巨量数据的时候,操作一个大列表时间开销也会得不偿失
II、yield执行方式
def foo():
print("starting...")
while True:
res = yield 4
print("res:",res)
g = foo()
#此时未打印出任何信息,说明只是生成了generator对象,并未执行函数
print('-'*30)
print('g_1',next(g))
#调用next,开始执行函数,并且到达yield这一步时,返回生成的4
print("*"*20)
print('g_2',next(g))
#res:none,说明是接着上一步开始执行,并且第二次循环到达yield这一步
print("#"*30)
print('g_3',next(g))
打印结果如下:
说明:
1、调用包含yield函数时,并不会执行函数,而是产生并返回一个生成器对象
2、第一次next取出一个值时,会将函数执行到第一个yield,停止
3、后面next时,会从上一个yield开始,接着执行,循环到下一个yield
后面均参照第三行。
III、继续深挖yield
def foo():
print("starting...")
for i in range(6):
res = yield 4
print("res:",res)
#当我们添加新的yield
for i in range(6):
res = yield 5
print("res",res)
g = foo()
#此时未打印出任何信息,说明只是生成了generator对象,并未执行函数
for i in range(8):
print(next(g))
结果是:
res None
5
上述结果5最后出现,说明yield会按照正常顺序进行执行,不会重新加载函数
转载自:https://www.cnblogs.com/gambler/