Python列表，元组，字符串学习

常识

Python内置了多种序列，本章重点讨论其中最常用的两种：列表和元组。另一种重要的序列是字符串

列表和元组的主要不同在于，列表是可以修改的，而元组不可以。这意味着列表适用于需要中途添加元素的情形，而元组适用于出于某种考虑需要禁止修改序列的情形。禁止修改序列通常出于技术方面的考虑，与Python的内部工作原理相关，这也是有些内置函数返回元组的原因所在。在你自己编写程序时，几乎在所有情况下都可使用列表来代替元组。一种例外情况是将元组用作字典键，这将在第4章讨论。在这种情况下，不能使用列表来代替元组，因为字典键是不允许修改的。

在需要处理一系列值时，序列很有用。在数据库中，你可能使用序列来表示人，其中第一个元素为姓名，而第二个元素为年龄。如果使用列表来表示（所有元素都放在方括号内，并用逗号隔开），将类似于下面这样：

>>> edward = ['Edward Gumby', 42]

序列还可包含其他序列，因此可创建一个由数据库中所有人员组成的列表：

>>> edward = ['Edward Gumby', 42]
>>> john = ['John Smith', 50]
>>> database = [edward, john]
>>> database
[['Edward Gumby', 42], ['John Smith', 50]]

Python支持一种数据结构的基本概念，名为容器（container）。容器基本上就是可包含其他对象的对象。两种主要的容器是序列（如列表和元组）和映射（如字典）。在序列中，每个元素都有编号，而在映射中，每个元素都有名称（也叫键）。映射将在第4章详细讨论。有一种既不是序列也不是映射的容器，它就是集合（set）

通用的序列操作

索引

greeting='Hello'
greeting[0]
'H'

用负数索引时，Python将从右（即从最后一个元素）开始往左数，因此1是最后一个元素的位置。

>>> greeting[-1]
'o'

例题：

	months = [
	'January',
	'February',
	'March',
	'April',
	'May',
	'June',
	'July',
	'August',
	'September',
	'October',
	'November',
	'December'
	]
	endings = ['st', 'nd', 'rd'] + 17 * ['th'] \
	+ ['st', 'nd', 'rd'] + 7 * ['th'] \
	+ ['st']

	year=input("请输入年份")
	mouth=input("请输入月份")
	day=input("请输入日子")
	mo=int(mouth)
	dy=int(day)
	dyy=day+endings[dy-1]
	print(months[mo-1],dyy,year)

\ 是一个续行符
17*[‘th’]=[‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’]

切片

除使用索引来访问单个元素外，还可使用切片（slicing）来访问特定范围内的元素。为此，可使用两个索引，并用冒号分隔：（含开头不含结尾）

>>>str='abcdefg'
>>>str[3:5]
'de'(下标为3,4不包含5)

总结来说就是 str[起始:终点:步长]
1,当步长为负数时倒叙
详细如下：

1. 绝妙的简写
假设你要访问前述数字列表中的最后三个元素，显然可以明确地指定这一点。
>>> numbers[7:10]
[8, 9, 10]
在这里，索引10指的是第11个元素：它并不存在，但确实是到达最后一个元素后再前进一步
所处的位置。明白了吗？如果要从列表末尾开始数，可使用负数索引。
>>> numbers[-3:-1]
[8, 9]
然而，这样好像无法包含最后一个元素。如果使用索引0，即到达列表末尾后再前进一步所
处的位置，结果将如何呢？
>>> numbers[-3:0]
[]
结果并不是你想要的。事实上，执行切片操作时，如果第一个索引指定的元素位于第二个索
引指定的元素后面（在这里，倒数第3个元素位于第1个元素后面），结果就为空序列。好在你能
使用一种简写：如果切片结束于序列末尾，可省略第二个索引。
>>> numbers[-3:]
[8, 9, 10]
同样，如果切片始于序列开头，可省略第一个索引。
>>> numbers[:3]
[1, 2, 3]
2.2 通用的序列操作 27
实际上，要复制整个序列，可将两个索引都省略。
>>> numbers[:]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
代码清单2-2是一个小程序，它提示用户输入一个URL，并从中提取域名。（这里假定输入的
URL类似于http://www.somedomainname.com。）
代码清单2-2 切片操作示例
# 从类似于http://www.something.com的URL中提取域名
url = input('Please enter the URL:')
domain = url[11:-4]
print("Domain name: " + domain)
这个程序的运行情况类似于下面这样：
Please enter the URL: http://www.python.org
Domain name: python

2. 更大的步长
执行切片操作时，你显式或隐式地指定起点和终点，但通常省略另一个参数，即步长。在普
通切片中，步长为1。这意味着从一个元素移到下一个元素，因此切片包含起点和终点之间的所
有元素。
>>> numbers[0:10:1]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
在这个示例中，指定了另一个数。你可能猜到了，这显式地指定了步长。如果指定的步长大
于1，将跳过一些元素。例如，步长为2时，将从起点和终点之间每隔一个元素提取一个元素。
>>> numbers[0:10:2]
[1, 3, 5, 7, 9]
numbers[3:6:3]
[4]
显式地指定步长时，也可使用前述简写。例如，要从序列中每隔3个元素提取1个，只需提供
步长4即可。
>>> numbers[::4]
[1, 5, 9]
当然，步长不能为0，否则无法向前移动，但可以为负数，即从右向左提取元素。
>>> numbers[8:3:-1]
[9, 8, 7, 6, 5]
>>> numbers[10:0:-2]
[10, 8, 6, 4, 2]
>>> numbers[0:10:-2]
[]
>>> numbers[::-2]
[10, 8, 6, 4, 2]
>>> numbers[5::-2]
[6, 4, 2]
>>> numbers[:5:-2]
[10, 8]

序列相加

可使用加法运算符来拼接序列。
>>> [1, 2, 3] + [4, 5, 6]
[1, 2, 3, 4, 5, 6]

>>> 'Hello,' + 'world!'
'Hello, world!'

>>> [1, 2, 3] + 'world!'
Traceback (innermost last):
File "<pyshell>", line 1, in ?
[1, 2, 3] + 'world!'
TypeError: can only concatenate list (not "string") to list
从错误消息可知，不能拼接列表和字符串，虽然它们都是序列。一般而言，不能拼接不同类
型的序列。

乘法
将序列与数x相乘时，将重复这个序列x次来创建一个新序列：

>>> 'python' * 5
'pythonpythonpythonpythonpython'
>>> [42] * 10
[42, 42, 42, 42, 42, 42, 42, 42, 42, 42]

成员资格
要检查特定的值是否包含在序列中，可使用运算符 in 。这个运算符与前面讨论的运算符（如乘法或加法运算符）稍有不同。它检查是否满足指定的条件，并返回相应的值：满足时返回 True ，不满足时返回 False 。这样的运算符称为布尔运算符，而前述真值称为布尔值。
in（在）运算符的用法：

>>> permissions = 'rw'
>>> 'w' in permissions
True
>>> 'x' in permissions
False
>>> users = ['mlh', 'foo', 'bar']
>>> input('Enter your user name: ') in users
Enter your user name: mlh
True
>>> subject = '$$$ Get rich now!!! $$$'
>>> '$$$' in subject
True

用in实现检查用户名和密码：

database = [
['albert', '1234'],
['dilbert', '4242'],
['smith', '7524'],
['jones', '9843']
]
username = input('User name: ')
pin = input('PIN code: ')
if [username, pin] in database: print('Access granted')

长度、最小值和最大值
内置函数 len 、 min 和 max 很有用，其中函数 len 返回序列包含的元素个数，而 min 和 max 分别返回序列中最小和最大的元素

>>> numbers = [100, 34, 678]
>>> len(numbers)
3
>>> max(numbers)
678
>>> min(numbers)
34
>>> max(2, 3)
3
>>> min(9, 3, 2, 5)
2

调用 max 和 min 时指定的实参并不是序列，而直接将数作为实参。

函数 list

>>> list('Hello')
['H', 'e', 'l', 'l', 'o']
请注意，可将任何序列（而不仅仅是字符串）作为 list 的参数。

基本的列表操作

1. 修改列表：给元素赋值

>>> x = [1, 1, 1]
>>> x[1] = 2
>>> x
[1, 2, 1]

2. 删除元素

>>> names = ['Alice', 'Beth', 'Cecil', 'Dee-Dee', 'Earl']
>>> del names[2]
>>> names
['Alice', 'Beth', 'Dee-Dee', 'Earl']

注意到Cecil彻底消失了，而列表的长度也从5变成了4。除用于删除列表元素外， del 语句还可用于删除其他东西。你可将其用于字典

3. 给切片赋值
切片是一项极其强大的功能，而能够给切片赋值让这项功能显得更加强大。

>>> name = list('Perl')
>>> name
['P', 'e', 'r', 'l']
>>> name[2:] = list('ar')
>>> name
['P', 'e', 'a', 'r']

从上述代码可知，可同时给多个元素赋值。你可能认为，这有什么大不了的，分别给每个元
素赋值不是一样的吗？确实如此，但通过使用切片赋值，可将切片替换为长度与其不同的序列。

>>> name = list('Perl')
>>> name[1:] = list('ython')
>>> name
['P', 'y', 't', 'h', 'o', 'n']

使用切片赋值还可在不替换原有元素的情况下插入新元素。

>>> numbers = [1, 5]
>>> numbers[1:1] = [2, 3, 4]
>>> numbers
[1, 2, 3, 4, 5]

在这里，我“替换”了一个空切片，相当于插入了一个序列。你可采取相反的措施来删除
切片。

>>> numbers
[1, 2, 3, 4, 5]
>>> numbers[1:4] = []
>>> numbers
[1, 5]

你可能猜到了，上述代码与 del numbers[1:4] 等效。现在，你可自己尝试执行步长不为1（乃至为负）的切片赋值了。

列表方法

总结：
len(seq) 返回序列的长度
list(seq)将序列转换为列表
max(args)返回序列或一组参数中的最大值
min(args)返回序列和一组参数中的最小值
reversed(seq)让你能够反向迭代序列
sorted(seq)返回一个有序列表，其中包含指定序列中的所有元素
tuple(seq)将序列转换为元组

append
方法 append 用于将一个对象附加到列表末尾。

 >>> lst = [1, 2, 3]
 >>> lst.append(4)
 >>> lst
 [1, 2, 3, 4]

clear
方法 clear 就地清空列表的内容。

 >>> lst = [1, 2, 3]
 >>> lst.clear()
 >>> lst
 []
 这类似于切片赋值语句 lst[:] = [] 。

copy
方法 copy 复制列表。前面说过，常规复制只是将另一个名称关联到列表。
```
 >>> a = [1, 2, 3]
 >>> b = a
 >>> b[1] = 4
 >>> a
 [1, 4, 3]
```
这样的结果是修改a或b的值两者都会改变
要让 a 和 b 指向不同的列表，就必须将 b 关联到 a 的副本。
```
 >>> a = [1, 2, 3]
 >>> b = a.copy()
 >>> b[1] = 4
 >>> a
 [1, 2, 3]
 这类似于使用 a[:] 或 list(a) ，它们也都复制 a 。
```

count
方法 count 计算指定的元素在列表中出现了多少次。

 >>> ['to', 'be', 'or', 'not', 'to', 'be'].count('to')
 2
 >>> x = [[1, 2], 1, 1, [2, 1, [1, 2]]]
 >>> x.count(1)
 2
 >>> x.count([1, 2])
 1
 这题注意看细节

extend
方法 extend 让你能够同时将多个值附加到列表末尾，为此可将这些值组成的序列作为参数提供给方法 extend 。换而言之，你可使用一个列表来扩展另一个列表。
```
 >>> a = [1, 2, 3]
 >>> b = [4, 5, 6]
 >>> a.extend(b)
 >>> a
 [1, 2, 3, 4, 5, 6]
```
这可能看起来类似于拼接，但存在一个重要差别，那就是将修改被扩展的序列（这里是 a ）。在常规拼接中，情况是返回一个全新的序列。
```
 >>> a = [1, 2, 3]
 >>> b = [4, 5, 6]
 >>> a + b
 [1, 2, 3, 4, 5, 6]
 >>> a
 [1, 2, 3]
```
如你所见，拼接出来的列表与前一个示例扩展得到的列表完全相同，但在这里 a 并没有被修改。鉴于常规拼接必须使用 a 和 b 的副本创建一个新列表，因此如果你要获得类似于下面的效果，拼接的效率将比 extend 低：
```
 >>> a = a + b
```
另外，拼接操作并非就地执行的，即它不会修改原来的列表。要获得与 extend 相同的效果，可将列表赋给切片，如下所示：
```
 	>>> a = [1, 2, 3]
 	>>> b = [4, 5, 6]
 	>>> a[len(a):] = b
 	>>> a
 	[1, 2, 3, 4, 5, 6]
```
这虽然可行，但可读性不是很高。

index
方法 index 在列表中查找指定值第一次出现的索引。

 >>> knights = ['We', 'are', 'the', 'knights', 'who', 'say', 'ni']
 >>> knights.index('who')
 4
 >>> knights.index('herring')
 Traceback (innermost last):
 File "<pyshell>", line 1, in ?
 knights.index('herring')
 ValueError: list.index(x): x not in list

搜索单词 ‘who’ 时，发现它位于索引4处。

 >>> knights[4]
 'who'

然而，搜索 ‘herring’ 时引发了异常，因为根本就没有找到这个单词。

insert
方法 insert 用于将一个对象插入列表。

 >>> numbers = [1, 2, 3, 5, 6, 7]
 >>> numbers.insert(3, 'four')
 >>> numbers
 [1, 2, 3, 'four', 5, 6, 7]

与 extend 一样，也可使用切片赋值来获得与 insert 一样的效果。

 >>> numbers = [1, 2, 3, 5, 6, 7]
 >>> numbers[3:3] = ['four']
 >>> numbers
 [1, 2, 3, 'four', 5, 6, 7]

这虽巧妙，但可读性根本无法与使用 insert 媲美。

pop
方法 pop 从列表中删除一个元素（末尾为最后一个元素），并返回这一元素。
```
 >>> x = [1, 2, 3]
 >>> x.pop()
 3
 >>> x
 [1, 2]
 >>> x.pop(0)
 1
 >>> x
 [2]
```
remove
方法 remove 用于删除第一个为指定值的元素。
```
 >>> x = ['to', 'be', 'or', 'not', 'to', 'be']
 >>> x.remove('be')
 >>> x
 ['to', 'or', 'not', 'to', 'be']
 >>> x.remove('bee')
 Traceback (innermost last):
 File "<pyshell>", line 1, in ?
 x.remove('bee')
 ValueError: list.remove(x): x not in list
```
如你所见，这只删除了为指定值的第一个元素，无法删除列表中其他为指定值的元素（这里是字符串 ‘bee’ ）。请注意， remove 是就地修改且不返回值的方法之一。不同于 pop 的是，它修改列表，但不返回任何值。
reverse
方法 reverse 按相反的顺序排列列表中的元素（我想你对此应该不会感到惊讶）。
```
>>> x = [1, 2, 3]
>>> x.reverse()
>>> x
[3, 2, 1]
```
注意到 reverse 修改列表，但不返回任何值（与 remove 和 sort 等方法一样）。

如果要按相反的顺序迭代序列，可使用函数 reversed 。这个函数不返回列表，而是返回一个迭代器。你可使用 list 将返回的对象转换为列表。
```
>>> x = [1, 2, 3]
>>> list(reversed(x))
[3, 2, 1]
```
sort
方法 sort 用于对列表就地排序
① 。就地排序意味着对原来的列表进行修改，使其元素按顺序排列，而不是返回排序后的列表的副本。
```
>>> x = [4, 6, 2, 1, 7, 9]
>>> x.sort()
>>> x
[1, 2, 4, 6, 7, 9]
```
前面介绍了多个修改列表而不返回任何值的方法，在大多数情况下，这种行为都相当自然（例如，对 append 来说就如此）。需要强调 sort 的行为也是这样的，因为这种行为给很多人都带来了困惑。在需要排序后的列表副本并保留原始列表不变时，通常会遭遇这种困惑。为实现这种目标，一种直观（但错误）的方式是像下面这样做：
>>> x = [4, 6, 2, 1, 7, 9]
>>> y = x.sort() # Don’t do this!
>>> print(y)
None
鉴于 sort 修改 x 且不返回任何值，最终的结果是 x 是经过排序的，而 y 包含 None 。为实现前述目标，正确的方式之一是先将 y 关联到 x 的副本，再对 y 进行排序，如下所示：
```
>>> x = [4, 6, 2, 1, 7, 9]
>>> y = x.copy()
>>> y.sort()
>>> x
[4, 6, 2, 1, 7, 9]
>>> y
[1, 2, 4, 6, 7, 9]
```
只是将 x 赋给 y 是不可行的，因为这样 x 和 y 将指向同一个列表。为获取排序后的列表的副本，另一种方式是使用函数 sorted 。
```
>>> x = [4, 6, 2, 1, 7, 9]
>>> y = sorted(x)
>>> x
[4, 6, 2, 1, 7, 9]
>>> y
[1, 2, 4, 6, 7, 9]
```
实际上，这个函数可用于任何序列，但总是返回一个列表
② 。
```
>>> sorted('Python')
['P', 'h', 'n', 'o', 't', 'y']
```
如果要将元素按相反的顺序排列，可先使用 sort （或 sorted ），再调用方法 reverse ，也可使用参数 reverse
高级排序
方法 sort 接受两个可选参数： key 和 reverse 。这两个参数通常是按名称指定的，称为关键字参数，将在第6章详细讨论。参数 key 类似于参数 cmp ：你将其设置为一个用于排序的函数。然而，不会直接使用这个函数来判断一个元素是否比另一个元素小，而是使用它来为每个元素创建一个键，再根据这些键对元素进行排序。因此，要根据长度对元素进行排序，可将参数 key 设置为函数 len 。
```
>>> x = ['aardvark', 'abalone', 'acme', 'add', 'aerate']
>>> x.sort(key=len)
>>> x
['add', 'acme', 'aerate', 'abalone', 'aardvark']
```
对于另一个关键字参数 reverse ，只需将其指定为一个真值（ True 或 False ），以指出是否要按相反的顺序对列表进行排序。
```
>>> x = [4, 6, 2, 1, 7, 9]
>>> x.sort(reverse=True)
>>> x
[9, 7, 6, 4, 2, 1]
```
函数 sorted 也接受参数 key 和 reverse 。在很多情况下，将参数 key 设置为一个自定义函数很有用。

元组：不可修改的序列

元组语法很简单，只要将一些值用逗号分隔，就能自动创建一个元组。

>>> 1, 2, 3
(1, 2, 3)

如你所见，元组还可用圆括号括起（这也是通常采用的做法）。

>>> (1, 2, 3)
(1, 2, 3)

空元组用两个不包含任何内容的圆括号表示。

>>> ()
()

如何表示只包含一个值的元组

>>> 42
42
这样不是元组

>>> 42,
(42,)
>>> (42,)
(42,)
这样的才是

最后两个示例创建的元组长度为1，而第一个示例根本没有创建元组。逗号至关重要，仅将值用圆括号括起不管用： (42) 与 42 完全等效。但仅仅加上一个逗号，就能完全改变表达式的值。

>>> 3 * (40 + 2)
126
>>> 3 * (40 + 2,)
(42, 42, 42)

函数 tuple 的工作原理与 list 很像：它将一个序列作为参数，并将其转换为元组。如果参数已经是元组，就原封不动地返回它。

>>> tuple([1, 2, 3])
(1, 2, 3)
>>> tuple('abc')
('a', 'b', 'c')
>>> tuple((1, 2, 3))
(1, 2, 3)

你可能意识到了，元组并不太复杂，而且除创建和访问其元素外，可对元组执行的操作不多。元组的创建及其元素的访问方式与其他序列相同。

>>> x = 1, 2, 3
>>> x[1]
2
>>> x[0:2]
(1, 2)

元组的切片也是元组，就像列表的切片也是列表一样。为何要熟悉元组呢？原因有以下两个。

 它们用作映射中的键（以及集合的成员），而列表不行。
 有些内置函数和方法返回元组，这意味着必须跟它们打交道。只要不尝试修改元组，与元组“打交道”通常意味着像处理列表一样处理它们（需要使用元组没有的 index 和 count等方法时例外）。

一般而言，使用列表足以满足对序列的需求。