python教程#数据结构和算法（1）

数据结构和算法

Python 提供了大量的内置数据结构，包括列表，集合以及字典。大多数情况下使

用这些数据结构是很简单的。但是，我们也会经常碰到到诸如查询，排序和过滤等等这

些普遍存在的问题。因此，这一章的目的就是讨论这些比较常见的问题和算法。另外，

我们也会给出在集合模块 collections 当中操作这些数据结构的方法。

1.1 解压序列赋值给多个变量

问题

现在有一个包含 N 个元素的元组或者是序列，怎样将它里面的值解压后同时赋值

给 N 个变量？

解决方案

任何的序列（或者是可迭代对象）可以通过一个简单的赋值语句解压并赋值给多

个变量。唯一的前提就是变量的数量必须跟序列元素的数量是一样的。

代码示例：

>>> p = (6, 8)

>>> x, y = p

>>> x

>>> y

>>>

>>> data = [ 'ACME', 50, 91.1, (2019, 11, 17) ]

>>> name, shares, price, date = data

>>> name

'ACME'

>>> date

(2019, 11, 17)

>>> name, shares, price, (year, mon, day) = data

>>> name

'ACME'

>>> year

2019

>>> mon

>>> day

>>>

如果变量个数和序列元素的个数不匹配，会产生一个异常。

代码示例：

>>> p = (6, 8)

>>> x, y, z = p

Traceback (most recent call last):

File "<stdin>", line 1, in <module>

ValueError: need more than 2 values to unpack

>>>

讨论

实际上，这种解压赋值可以用在任何可迭代对象上面，而不仅仅是列表或者元组。

包括字符串，文件对象，迭代器和生成器。

代码示例：

>>> s = 'Hello'

>>> a, b, c, d, e = s

>>> a

'H'

>>> b

'e'

>>> e

'o'

>>>

有时候，你可能只想解压一部分，丢弃其他的值。对于这种情况 Python 并没有提

供特殊的语法。但是你可以使用任意变量名去占位，到时候丢掉这些变量就行了。

代码示例：

>>> data = [ 'ACME', 50, 91.1, (2012, 12, 21) ]

>>> _, shares, price, _ = data

>>> shares

>>> price

91.1

>>>

你必须保证你选用的那些占位变量名在其他地方没被使用到。

1.2 解压可迭代对象赋值给多个变量

问题

如果一个可迭代对象的元素个数超过变量个数时，会抛出一个 ValueError 。那么

怎样才能从这个可迭代对象中解压出 N 个元素出来？

解决方案

Python 的星号表达式可以用来解决这个问题。比如，你在学习一门课程，在学期

末的时候，你想统计下家庭作业的平均成绩，但是排除掉第一个和最后一个分数。如果

只有四个分数，你可能就直接去简单的手动赋值，但如果有 24 个呢？这时候星号表达

式就派上用场了：

def drop_first_last(grades):

first, *middle, last = grades

return avg(middle)

另外一种情况，假设你现在有一些用户的记录列表，每条记录包含一个名字、邮

件，接着就是不确定数量的电话号码。你可以像下面这样分解这些记录：

>>> record = ('Dave', '[email protected]', '773-555-1212', '847-555-1212')

>>> name, email, *phone_numbers = record

>>> name

'Dave'

>>> email

'[email protected]'

>>> phone_numbers

['773-555-1212', '847-555-1212']

>>>

值得注意的是上面解压出的 phone_numbers 变量永远都是列表类型，不管解压的

电话号码数量是多少（包括 0 个）。所以，任何使用到 phone_numbers 变量的代码就不

需要做多余的类型检查去确认它是否是列表类型了。

星号表达式也能用在列表的开始部分。比如，你有一个公司前 8 个月销售数据的

序列，但是你想看下最近一个月数据和前面 7 个月的平均值的对比。你可以这样做：

*trailing_qtrs, current_qtr = sales_record

trailing_avg = sum(trailing_qtrs) / len(trailing_qtrs)

return avg_comparison(trailing_avg, current_qtr)

下面是在 Python 解释器中执行的结果：

>>> *trailing, current = [10, 8, 7, 1, 9, 5, 10, 3]

>>> trailing

[10, 8, 7, 1, 9, 5, 10]

>>> current

讨论

扩展的迭代解压语法是专门为解压不确定个数或任意个数元素的可迭代对象而设

计的。通常，这些可迭代对象的元素结构有确定的规则（比如第 1 个元素后面都是电

话号码），星号表达式让开发人员可以很容易的利用这些规则来解压出元素来。而不是

通过一些比较复杂的手段去获取这些关联的元素值。

值得注意的是，星号表达式在迭代元素为可变长元组的序列时是很有用的。比如，

下面是一个带有标签的元组序列：

records = [

('foo', 1, 2),

('bar', 'hello'),

('foo', 3, 4),

]

def do_foo(x, y):

print('foo', x, y)

def do_bar(s):

print('bar', s)

for tag, *args in records:

if tag == 'foo':

do_foo(*args)

elif tag == 'bar':

do_bar(*args)

星号解压语法在字符串操作的时候也会很有用，比如字符串的分割。

代码示例：

>>> line = 'nobody:*:-2:-2:Unprivileged User:/var/empty:/usr/bin/false'

>>> uname, *fields, homedir, sh = line.split(':')

>>> uname

'nobody'

>>> homedir

'/var/empty'

>>> sh

'/usr/bin/false'

>>>

有时候，你想解压一些元素后丢弃它们，你不能简单就使用 * ，但是你可以使用一

个普通的废弃名称，比如 _ 或者 ign （ignore）。

代码示例：

>>> record = ('ACME', 50, 123.45, (12, 18, 2012))

>>> name, *_, (*_, year) = record

>>> name

'ACME'

>>> year

2012

>>>

在很多函数式语言中，星号解压语法跟列表处理有许多相似之处。比如，如果你有

一个列表，你可以很容易的将它分割成前后两部分：

>>> items = [1, 10, 7, 4, 5, 9]

>>> head, *tail = items

>>> head

>>> tail

[10, 7, 4, 5, 9]

>>>

如果你够聪明的话，还能用这种分割语法去巧妙的实现递归算法。比如：

>>> def sum(items):

...

head, *tail = items

...

return head + sum(tail) if tail else head

...

>>> sum(items)

>>>

然后，由于语言层面的限制，递归并不是 Python 擅长的。因此，最后那个递归演

示仅仅是个好奇的探索罢了，对这个不要太认真了。

python教程#数据结构和算法（1）

猜你喜欢