Effective Python(二)
第九条:用生成器表达式来改写数据量较大的列表推导。
当数据量很大时,如果使用普通的列表推导,会一次性将所有数据存储到内存中,站用量大。
为了解决此问题,python提供了生成器表达式(generator expression).
>>> a = [1, 2, 3, 4, 5, 6]
>>> it = (x for x in a)
>>> it
<generator object <genexpr> at 0x000001FD98F00258>
# 使用next()函数按照生成器表示输出下一个值
>>> print(next(it))
1
>>> print(next(it))
2
# 生成器也可以互相结合
>>> roots = (x**0.5 for x in it)
>>> print(next(roots))
1.7320508075688772
ps: 博主记得,keras框架中有个读取数据的方式就是使用了generator生成器的方式来读取数据,大大地节省了主存的容量
第九条:尽量用enumerate取代range
在一系列整数上迭代,range函数很有用:
>>> for i in range(10):
... print(i)
...
0
1
2
3
4
5
6
7
8
9
对于字符串列表,也可以使用range函数迭代:
>>> flavor_list = ['vanilla', 'chocolath', 'pecan', 'strawberry']
>>> for flavor in flavor_list:
... print("%s is delicious" % flavor)
...
vanilla is delicious
chocolath is delicious
pecan is delicious
strawberry is delicious
## 又或者这样
>>> for i in range(len(flavor_list)):
... flavor = flavor_list[i]
... print("%d: %s" % (i+1, flavor))
...
1: vanilla
2: chocolath
3: pecan
4: strawberry
以上代码可能显得有些生硬,有时还要先获取列表的长度来访问其下标。
python内置了enumerate函数可以解决此问题。enumerate可以包装迭代器为生成器,然后产生输出值(index, value)
>>> for i, flavor in enumerate(flavor_list):
... print("%d: %s" % (i+1, flavor))
...
1: vanilla
2: chocolath
3: pecan
4: strawberry
## 也可以指明下标的起始计数
>>> for i, flavor in enumerate(flavor_list, 1):
... print("%d: %s" % (i+1, flavor))
...
2: vanilla
3: chocolath
4: pecan
5: strawberry
用zip函数同时遍历两个迭代器
>>> a = [1, 4, 2, 5, 7]
>>> b = [2, 3, 5, 6, 9]
>>> count = 0
>>> for i, j in zip(a, b):
... if i > j:
... count+=1
...
>>> print(count)
1