前部分转自:
https://www.cnblogs.com/Tsukasa/p/6613934.html
通过列表list生成器,我们可以直接创建一个列表
1
2
3
|
>>> x
=
list
(
range
(
1
,
11
))
>>> x
[
1
,
2
,
3
,
4
,
5
,
6
,
7
,
8
,
9
,
10
]
|
但是,受到内存的限制,列表的容量是有限的,而且创建一个包含100万1个亿的列表时候,不仅会占用很大的储存空间,如果有事我们只要访问前面几个元素,那后面大多数元素都白白浪费了。而且运作效率低下。
如果列表元素可以按某种算法推算出来,那我们是否可以在循环的过程中不断推算出后面的元素呢?这样就不必要创建一个完整的list列表了,从而提升程序的效率。在python中,这种一边循环一边计算的机制,称为生成器generator
要创建一个generator,有很多方法:
第一种方法很简单,就是只要把一个列表生成试的 [ ] 改成 ( ) 就可以创建一个generator:
1
2
3
4
5
6
|
>>> l
=
[x
*
x
for
x
in
range
(
10
)]
>>> l
[
0
,
1
,
4
,
9
,
16
,
25
,
36
,
49
,
64
,
81
]
>>> g
=
(x
*
x
for
x
in
range
(
10
))
>>> g
<generator
object
<genexpr> at
0x00000000035BC410
>
|
L 是一个list, 而 G 是一个generator:它们在创建时候最基本的不同就list是 [ ] ,而generator是 ( ) 。
我们可以直接打印出list的全部元素,但是怎么打印出generator的全部元素呢?
1
2
|
>>> g
<generator
object
<genexpr> at
0x00000000035BC410
>
|
如果要一个个打印出来,可以通过next()函数来获得generator的下一个返回值。
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
|
>>>
next
(g)
0
>>>
next
(g)
1
>>>
next
(g)
4
>>>
next
(g)
9
>>>
next
(g)
16
>>>
next
(g)
25
>>>
next
(g)
36
>>>
next
(g)
49
>>>
next
(g)
64
>>>
next
(g)
81
>>>
next
(g)
Traceback (most recent call last):
File
"<pyshell#18>"
, line
1
,
in
<module>
next
(g)
StopIteration
|
generator保存的是算法,每次调用 next(g)的时候才会计算 g 的下一个元素值,直到计算到最后一个元素,没有下一个元素时,会返回stopIteration的错误。
当然,上面这种不停调用next (g)这种方法实在是太繁琐了,正确的方法是使用for循环,因为generator也是一个可迭代对象:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
|
>>> g
=
(x
*
x
for
x
in
range
(
10
))
>>>
for
n
in
g:
...
print
(n)
...
0
1
4
9
16
25
36
49
64
81
|
jieba的cut_for_search输出可以按:
seg_list = jieba.cut_for_search("你好明天")
print(",".join(seg_list)) seglist 为generator