Python3学习之路~4.2 迭代器

可以直接作用于for循环的数据类型有以下几种:

一类是集合数据类型,如listtupledictsetstr等;

一类是generator,包括生成器和带yield的generator function。

这些可以直接作用于for循环的对象统称为可迭代对象:Iterable

可以使用isinstance()判断一个对象是否是Iterable对象:

from collections import Iterable

def fib(max):
    n,a,b=0,0,1
    while n<max:
        #print(b)
        yield b
        a,b = b,a+b
        n=n+1
    return 'done'

print(isinstance([],Iterable)) # True
print(isinstance((),Iterable)) # True
print(isinstance({},Iterable)) # True
print(isinstance(set([]),Iterable)) # True
print(isinstance('abc',Iterable)) # True
print(isinstance((x for x in range(10)),Iterable)) # True
print(isinstance(fib(10),Iterable)) # True
print(isinstance(100,Iterable)) # False
View Code

而生成器不但可以作用于for循环,还可以被next()函数不断调用并返回下一个值,直到最后抛出StopIteration错误表示无法继续返回下一个值了。

*可以被next()函数调用并不断返回下一个值的对象称为迭代器:Iterator

可以使用isinstance()判断一个对象是否是Iterator对象:

from collections import Iterator

def fib(max):
    n,a,b=0,0,1
    while n<max:
        #print(b)
        yield b
        a,b = b,a+b
        n=n+1
    return 'done'

print(isinstance([],Iterator)) # False
print(isinstance((),Iterator)) # False
print(isinstance({},Iterator)) # False
print(isinstance(set([]),Iterator)) # False
print(isinstance('abc',Iterator)) # False
print(isinstance((x for x in range(10)),Iterator)) # True
print(isinstance(fib(10),Iterator)) # True
print(isinstance(100,Iterator)) # False
View Code

生成器都是Iterator对象,但listtupledictsetstr等虽然是Iterable,却不是Iterator

listtupledictsetstrIterable变成Iterator可以使用iter()函数:

from collections import Iterator

print(isinstance(iter([]),Iterator)) # True
print(isinstance(iter(()),Iterator)) # True
print(isinstance(iter({}),Iterator)) # True
print(isinstance(iter(set([])),Iterator)) # True
print(isinstance(iter('abc'),Iterator)) # True
View Code

你可能会问,为什么listtupledictsetstr等数据类型不是Iterator

这是因为Python的Iterator对象表示的是一个数据流,Iterator对象可以被next()函数调用并不断返回下一个数据,直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列,但我们却不能提前知道序列的长度,只能不断通过next()函数实现按需计算下一个数据,所以Iterator的计算是惰性的,只有在需要返回下一个数据时它才会计算。

Iterator甚至可以表示一个无限大的数据流,例如全体自然数。而使用list是永远不可能存储全体自然数的。

小结

凡是可作用于for循环的对象都是Iterable类型;

凡是可作用于next()函数的对象都是Iterator类型,它们表示一个惰性计算的序列;

集合数据类型如listtupledictsetstr等是Iterable但不是Iterator,不过可以通过iter()函数获得一个Iterator对象。

Python的for循环本质上就是通过不断调用next()函数实现的,例如:

for x in [1, 2, 3, 4, 5]:
    pass

实际上完全等价于:

# 首先获得Iterator对象:
it = iter([1, 2, 3, 4, 5])
# 循环:
while True:
    try:
        # 获得下一个值:
        x = next(it)
    except StopIteration:
        # 遇到StopIteration就退出循环
        break

另外,在Python2.7中,range()生成一个列表,xrange()生成一个生成器。

在Python3.5中,range()直接生成一个生成器,xrange()没有了。

#python 2.7
>>> range(10)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> type(range(10))
<type 'list'>
>>> xrange(10)
xrange(10)
>>> type(xrange(10))
<type 'xrange'>

#python 3.5
>>> range(10)
range(0, 10)
>>> type(range(10))
<class 'range'>
>>> xrange(10)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
NameError: name 'xrange' is not defined
View Code

文件也是一种迭代器Iterator

from collections import Iterable
from collections import Iterator
f=open('yesterday.txt',encoding='UTF-8')
print(isinstance(f,Iterable)) #True
print(isinstance(f,Iterator)) #True
View Code

猜你喜欢

转载自www.cnblogs.com/zhengna/p/9211871.html
今日推荐