python可迭代对象,迭代器,生成器,协程一次性搞清楚

设计模式:迭代

迭代是一种设计模式,解决有序便利序列的问题。通用的可迭代对象需要支持done和next方法。 伪代码如下:

while not iterator.done():  
    item = iterator.next()  
    .....
复制代码

python:可迭代对象和迭代器

python的可迭代对象需要实现__iter__()方法,返回一个迭代器。for循环和顶级函数iter(obj)调用obj的__iter__()方法,返回一个迭代器。迭代器本身也是可迭代对象,所以也需要实现__iter__()方法,返回自身,同时也需要实现__next__()方法,获取下一个元素。简单类示例:

class Iterable:
    def __init__(self,string):
        self.string = string
        
    def __iter__():
        return Iterator(self.string)
    
class Itrator:
    def __init__(self,string):
        self.string = string
        self.words = list(string)
        self.index = 0
        
    def __iter__(self):
        return self
        
    def __next__(self):
        if self.index == len(self.words):
            raise StopIteration  # 元素遍历完成抛出错误,for循环自动处理
        
        item = self.words[self.index]
        self.index += 1
        return item
复制代码

为什么要有生成器?

生成器帮助迭代器省内存。在上面的例子可以看出,可迭代对象会一次性把所有元素生成并保存。但是有时候,我们只关注当前处理的元素。如果元素数量庞大,比如说在处理大量日志分析的时候,一次性把所有行加载到内存,导致内存浪费严重。所以才有了生成器。

python的生成器实现

yield关键字让python生成器实现超级方便。yield可看成是代码执行暂停,直到下一次next()方法调用,然后遇到下一个yield再次暂停。另外,yield xxx 表示回元素xxx。

def my_generator(stirng):
    for x in string:
        yield x
复制代码

需要注意的是,虽然我们定义的是函数,但是实际上,python会自动将其转换成一个生成器对象,而不是一个普通的函数对象。

协程

协程程用是让我们可以往生成器发送数据。协程与生成器语法区别是: xx = yield xxx,即yield左边有赋值语句,send(a)方法会将a赋值给xx,协程对象返回xxx。协程的这个特征,被用于异步编程和并发编程,在程序遇到IO时自动暂停切换。 协程执行顺序:

  1. yield 出现和生成器暂停
  2. 在函数外执行send()方法,且激活了生成器
  3. 发生的值赋值给yiled语句左侧变量
  4. 生成器继续执行,直到遇到下一个yield语句。

猜你喜欢

转载自juejin.im/post/7095157324079169566