说说在 Python 中如何使用列表推导

1 从示例说起

Luciano Ramalho 举了这样一个示例,把一个字符串转为 Unicode 码的列表。

传统写法是这样的:

symbols='@#$%^&'
codes=[]
for symbol in symbols:
    codes.append(ord(symbol))

运行结果:

INFO - codes -> [64, 35, 36, 37, 94, 38]

ord() 函数是 chr() 函数(对于8位的ASCII字符串)或 unichr() 函数(对于Unicode对象)的配对函数,它以一个字符(长度为1的字符串)作为参数,返回对应的 ASCII 数值,或者 Unicode 数值,如果所给的 Unicode 字符超出了 Python 定义范围,则会引发 TypeError 异常。

而列表推导的写法是这样的:

codes=[ord(symbol) for symbol in symbols]

这种写法给人的第一印象是简洁。

列表推导使用原则:只用列表推导来创建新的列表,并且尽量保持简洁。如果列表推导的代码超过了两行,那么我们就要考虑使用 for 循环来重构代码。

2 局部作用域

在 Python3 中,表达式内部的变量和赋值只在局部起作用,即具有局部作用域。因此与外层的同名变量互不影响。

x='ABC'
dummy=[ord(x) for x in x]
logging.info('x -> %s',x)
logging.info('dummy -> %s',dummy)

运行结果:

INFO - x -> ABC
INFO - dummy -> [65, 66, 67]

3 比较列表推导和 map/filter 组合

3.1 filter()

Python 的 filter() 函数用于过滤序列,过滤掉不符合条件的元素,然后返回由符合条件元素组成的新列表。

语法为:

filter(function, iterable)

该函数接收两个参数,第一个为函数,第二个为序列,序列的每个元素作为参数传递给函数进行判断,然后返回 True 或 False,最后将返回 True 的元素放到新列表中。

3.2 map()

而 map() 会根据提供的函数对指定序列做映射。

第一个参数 function 以参数序列中的每一个元素调用 function 函数,返回包含每次调用 function 函数返回值的新列表。

3.3 比较

我们用一个示例来比较列表推导和 map/filter 组合在写法上的区别。假设需要把一个字符串转换为 ascii 码数组,该数组需过滤掉码值小于 38 的值。

map/filter 组合方式:

list(filter(lambda c:c>37,map(ord,symbols)))

列表推导方式:

[ord(s) for s in symbols if ord(s)>37]

对比发现,列表推导方式的可读性更高。

4 计算笛卡儿积

笛卡尔乘积是指在数学中,两个集合X和Y的笛卡尔积(Cartesian product),又称直积,表示为X × Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员。

Luciano Ramalho 举了一个扑克牌的例子,来说明什么是笛卡尔乘积。含有 4 种花色和 3 种牌面的列表的笛卡儿积,结果是一个包含 12 个元素的列表。

假设有 3 种不同尺寸(S、M、L)的 T 恤衫,每个尺寸都有 2 个颜色(黑色或白色),尺寸与颜色的笛卡尔积就会得到 6 种组合。

colors=['black','white']
sizes=['S','M','L']
# 先颜色再尺码
tshirts=[(color,size) for color in colors for size in sizes]
logging.info('tshirts -> %s',tshirts)
# 先尺码再颜色
tshirts=[(color,size) for size in sizes for color in colors]
logging.info('tshirts -> %s',tshirts)

运行结果:

INFO - tshirts -> [('black', 'S'), ('black', 'M'), ('black', 'L'), ('white', 'S'), ('white', 'M'), ('white', 'L')]
INFO - tshirts -> [('black', 'S'), ('white', 'S'), ('black', 'M'), ('white', 'M'), ('black', 'L'), ('white', 'L')]

for color in colors for size in sizes 表示先按照颜色排序,然后再按照尺码排序;而 for size in sizes for color in colors 则表示先按照尺码排序,然后再按照颜色排序。

双重迭代的顺序,也会影响输出结果:

for color in colors:
    for size in sizes:
        logging.info('(color,size) -> %s',(color,size))

logging.info('\n')
for size in sizes:
    for color in colors:
        logging.info('(color,size) -> %s',(color,size))

运行结果:

INFO - (color,size) -> ('black', 'S')
INFO - (color,size) -> ('black', 'M')
INFO - (color,size) -> ('black', 'L')
INFO - (color,size) -> ('white', 'S')
INFO - (color,size) -> ('white', 'M')
INFO - (color,size) -> ('white', 'L')
INFO - 

INFO - (color,size) -> ('black', 'S')
INFO - (color,size) -> ('white', 'S')
INFO - (color,size) -> ('black', 'M')
INFO - (color,size) -> ('white', 'M')
INFO - (color,size) -> ('black', 'L')
INFO - (color,size) -> ('white', 'L')

猜你喜欢

转载自blog.csdn.net/deniro_li/article/details/107576151