Python列表,元组,字符串学习

常识

Python内置了多种序列,本章重点讨论其中最常用的两种:列表和元组。另一种重要的序列是字符串

列表和元组的主要不同在于,列表是可以修改的,而元组不可以。这意味着列表适用于需要中途添加元素的情形,而元组适用于出于某种考虑需要禁止修改序列的情形。禁止修改序列通常出于技术方面的考虑,与Python的内部工作原理相关,这也是有些内置函数返回元组的原因所在。在你自己编写程序时,几乎在所有情况下都可使用列表来代替元组。一种例外情况是将元组用作字典键,这将在第4章讨论。在这种情况下,不能使用列表来代替元组,因为字典键是不允许修改的。

在需要处理一系列值时,序列很有用。在数据库中,你可能使用序列来表示人,其中第一个元素为姓名,而第二个元素为年龄。如果使用列表来表示(所有元素都放在方括号内,并用逗号隔开),将类似于下面这样:

>>> edward = ['Edward Gumby', 42]

序列还可包含其他序列,因此可创建一个由数据库中所有人员组成的列表:

>>> edward = ['Edward Gumby', 42]
>>> john = ['John Smith', 50]
>>> database = [edward, john]
>>> database
[['Edward Gumby', 42], ['John Smith', 50]]

Python支持一种数据结构的基本概念,名为 容器(container)。容器基本上就是可包含其他对象的对象。两种主要的容器是序列(如列表和元组)和映射(如字典)。在序列中,每个元素都有编号,而在映射中,每个元素都有名称(也叫键)。映射将在第4章详细讨论。有一种既不是序列也不是映射的容器,它就是集合(set)

通用的序列操作

索引

greeting='Hello'
greeting[0]
'H'

用负数索引时,Python将从右(即从最后一个元素)开始往左数,因此1是最后一个元素的位置。

>>> greeting[-1]
'o'

例题:

	months = [
	'January',
	'February',
	'March',
	'April',
	'May',
	'June',
	'July',
	'August',
	'September',
	'October',
	'November',
	'December'
	]
	endings = ['st', 'nd', 'rd'] + 17 * ['th'] \
	+ ['st', 'nd', 'rd'] + 7 * ['th'] \
	+ ['st']

	year=input("请输入年份")
	mouth=input("请输入月份")
	day=input("请输入日子")
	mo=int(mouth)
	dy=int(day)
	dyy=day+endings[dy-1]
	print(months[mo-1],dyy,year)

\ 是一个续行符
17*[‘th’]=[‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’, ‘th’]

切片

除使用索引来访问单个元素外,还可使用切片(slicing)来访问特定范围内的元素。为此,可使用两个索引,并用冒号分隔:(含开头不含结尾)

>>>str='abcdefg'
>>>str[3:5]
'de'(下标为3,4不包含5)

总结来说就是 str[起始:终点:步长]
1,当步长为负数时倒叙
详细如下:

1. 绝妙的简写
假设你要访问前述数字列表中的最后三个元素,显然可以明确地指定这一点。
>>> numbers[7:10]
[8, 9, 10]
在这里,索引10指的是第11个元素:它并不存在,但确实是到达最后一个元素后再前进一步
所处的位置。明白了吗?如果要从列表末尾开始数,可使用负数索引。
>>> numbers[-3:-1]
[8, 9]
然而,这样好像无法包含最后一个元素。如果使用索引0,即到达列表末尾后再前进一步所
处的位置,结果将如何呢?
>>> numbers[-3:0]
[]
结果并不是你想要的。事实上,执行切片操作时,如果第一个索引指定的元素位于第二个索
引指定的元素后面(在这里,倒数第3个元素位于第1个元素后面),结果就为空序列。好在你能
使用一种简写:如果切片结束于序列末尾,可省略第二个索引。
>>> numbers[-3:]
[8, 9, 10]
同样,如果切片始于序列开头,可省略第一个索引。
>>> numbers[:3]
[1, 2, 3]
2.2 通用的序列操作 27
实际上,要复制整个序列,可将两个索引都省略。
>>> numbers[:]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
代码清单2-2是一个小程序,它提示用户输入一个URL,并从中提取域名。(这里假定输入的
URL类似于http://www.somedomainname.com。)
代码清单2-2 切片操作示例
# 从类似于http://www.something.com的URL中提取域名
url = input('Please enter the URL:')
domain = url[11:-4]
print("Domain name: " + domain)
这个程序的运行情况类似于下面这样:
Please enter the URL: http://www.python.org
Domain name: python

2. 更大的步长
执行切片操作时,你显式或隐式地指定起点和终点,但通常省略另一个参数,即步长。在普
通切片中,步长为1。这意味着从一个元素移到下一个元素,因此切片包含起点和终点之间的所
有元素。
>>> numbers[0:10:1]
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
在这个示例中,指定了另一个数。你可能猜到了,这显式地指定了步长。如果指定的步长大
于1,将跳过一些元素。例如,步长为2时,将从起点和终点之间每隔一个元素提取一个元素。
>>> numbers[0:10:2]
[1, 3, 5, 7, 9]
numbers[3:6:3]
[4]
显式地指定步长时,也可使用前述简写。例如,要从序列中每隔3个元素提取1个,只需提供
步长4即可。
>>> numbers[::4]
[1, 5, 9]
当然,步长不能为0,否则无法向前移动,但可以为负数,即从右向左提取元素。
>>> numbers[8:3:-1]
[9, 8, 7, 6, 5]
>>> numbers[10:0:-2]
[10, 8, 6, 4, 2]
>>> numbers[0:10:-2]
[]
>>> numbers[::-2]
[10, 8, 6, 4, 2]
>>> numbers[5::-2]
[6, 4, 2]
>>> numbers[:5:-2]
[10, 8]

序列相加

可使用加法运算符来拼接序列。
>>> [1, 2, 3] + [4, 5, 6]
[1, 2, 3, 4, 5, 6]

>>> 'Hello,' + 'world!'
'Hello, world!'

>>> [1, 2, 3] + 'world!'
Traceback (innermost last):
File "<pyshell>", line 1, in ?
[1, 2, 3] + 'world!'
TypeError: can only concatenate list (not "string") to list
从错误消息可知,不能拼接列表和字符串,虽然它们都是序列。一般而言,不能拼接不同类
型的序列。

乘法
将序列与数x相乘时,将重复这个序列x次来创建一个新序列:

>>> 'python' * 5
'pythonpythonpythonpythonpython'
>>> [42] * 10
[42, 42, 42, 42, 42, 42, 42, 42, 42, 42]

成员资格
要检查特定的值是否包含在序列中,可使用运算符 in 。这个运算符与前面讨论的运算符(如乘法或加法运算符)稍有不同。它检查是否满足指定的条件,并返回相应的值:满足时返回 True ,不满足时返回 False 。这样的运算符称为布尔运算符,而前述真值称为布尔值。
in(在)运算符的用法:

>>> permissions = 'rw'
>>> 'w' in permissions
True
>>> 'x' in permissions
False
>>> users = ['mlh', 'foo', 'bar']
>>> input('Enter your user name: ') in users
Enter your user name: mlh
True
>>> subject = '$$$ Get rich now!!! $$$'
>>> '$$$' in subject
True

用in实现检查用户名和密码:

database = [
['albert', '1234'],
['dilbert', '4242'],
['smith', '7524'],
['jones', '9843']
]
username = input('User name: ')
pin = input('PIN code: ')
if [username, pin] in database: print('Access granted')

长度、最小值和最大值
内置函数 len 、 min 和 max 很有用,其中函数 len 返回序列包含的元素个数,而 min 和 max 分别返回序列中最小和最大的元素

>>> numbers = [100, 34, 678]
>>> len(numbers)
3
>>> max(numbers)
678
>>> min(numbers)
34
>>> max(2, 3)
3
>>> min(9, 3, 2, 5)
2

调用 max 和 min 时指定的实参并不是序列,而直接将数作为实参。

函数 list

>>> list('Hello')
['H', 'e', 'l', 'l', 'o']
请注意,可将任何序列(而不仅仅是字符串)作为 list 的参数。

基本的列表操作

1. 修改列表:给元素赋值

>>> x = [1, 1, 1]
>>> x[1] = 2
>>> x
[1, 2, 1]

2. 删除元素

>>> names = ['Alice', 'Beth', 'Cecil', 'Dee-Dee', 'Earl']
>>> del names[2]
>>> names
['Alice', 'Beth', 'Dee-Dee', 'Earl']

注意到Cecil彻底消失了,而列表的长度也从5变成了4。除用于删除列表元素外, del 语句还可用于删除其他东西。你可将其用于字典

3. 给切片赋值
切片是一项极其强大的功能,而能够给切片赋值让这项功能显得更加强大。

>>> name = list('Perl')
>>> name
['P', 'e', 'r', 'l']
>>> name[2:] = list('ar')
>>> name
['P', 'e', 'a', 'r']

从上述代码可知,可同时给多个元素赋值。你可能认为,这有什么大不了的,分别给每个元
素赋值不是一样的吗?确实如此,但通过使用切片赋值,可将切片替换为长度与其不同的序列。

>>> name = list('Perl')
>>> name[1:] = list('ython')
>>> name
['P', 'y', 't', 'h', 'o', 'n']

使用切片赋值还可在不替换原有元素的情况下插入新元素。

>>> numbers = [1, 5]
>>> numbers[1:1] = [2, 3, 4]
>>> numbers
[1, 2, 3, 4, 5]

在这里,我“替换”了一个空切片,相当于插入了一个序列。你可采取相反的措施来删除
切片。

>>> numbers
[1, 2, 3, 4, 5]
>>> numbers[1:4] = []
>>> numbers
[1, 5]

你可能猜到了,上述代码与 del numbers[1:4] 等效。现在,你可自己尝试执行步长不为1(乃至为负)的切片赋值了。

列表方法

总结:
len(seq) 返回序列的长度
list(seq)将序列转换为列表
max(args)返回序列或一组参数中的最大值
min(args)返回序列和一组参数中的最小值
reversed(seq)让你能够反向迭代序列
sorted(seq)返回一个有序列表,其中包含指定序列中的所有元素
tuple(seq)将序列转换为元组

  1. append
    方法 append 用于将一个对象附加到列表末尾。

     >>> lst = [1, 2, 3]
     >>> lst.append(4)
     >>> lst
     [1, 2, 3, 4]
    
  2. clear
    方法 clear 就地清空列表的内容。

     >>> lst = [1, 2, 3]
     >>> lst.clear()
     >>> lst
     []
     这类似于切片赋值语句 lst[:] = [] 。			
    
  3. copy
    方法 copy 复制列表。前面说过,常规复制只是将另一个名称关联到列表。

     >>> a = [1, 2, 3]
     >>> b = a
     >>> b[1] = 4
     >>> a
     [1, 4, 3]
    

    这样的结果是修改a或b的值两者都会改变
    要让 a 和 b 指向不同的列表,就必须将 b 关联到 a 的副本。

     >>> a = [1, 2, 3]
     >>> b = a.copy()
     >>> b[1] = 4
     >>> a
     [1, 2, 3]
     这类似于使用 a[:] 或 list(a) ,它们也都复制 a 。
    
  4. count
    方法 count 计算指定的元素在列表中出现了多少次。

     >>> ['to', 'be', 'or', 'not', 'to', 'be'].count('to')
     2
     >>> x = [[1, 2], 1, 1, [2, 1, [1, 2]]]
     >>> x.count(1)
     2
     >>> x.count([1, 2])
     1
     这题注意看细节
    
  5. extend
    方法 extend 让你能够同时将多个值附加到列表末尾,为此可将这些值组成的序列作为参数提供给方法 extend 。换而言之,你可使用一个列表来扩展另一个列表。

     >>> a = [1, 2, 3]
     >>> b = [4, 5, 6]
     >>> a.extend(b)
     >>> a
     [1, 2, 3, 4, 5, 6]
    

    这可能看起来类似于拼接,但存在一个重要差别,那就是将修改被扩展的序列(这里是 a )。在常规拼接中,情况是返回一个全新的序列。

     >>> a = [1, 2, 3]
     >>> b = [4, 5, 6]
     >>> a + b
     [1, 2, 3, 4, 5, 6]
     >>> a
     [1, 2, 3]
    

    如你所见,拼接出来的列表与前一个示例扩展得到的列表完全相同,但在这里 a 并没有被修改。鉴于常规拼接必须使用 a 和 b 的副本创建一个新列表,因此如果你要获得类似于下面的效果,拼接的效率将比 extend 低:

     >>> a = a + b
    

    另外,拼接操作并非就地执行的,即它不会修改原来的列表。要获得与 extend 相同的效果,可将列表赋给切片,如下所示:

     	>>> a = [1, 2, 3]
     	>>> b = [4, 5, 6]
     	>>> a[len(a):] = b
     	>>> a
     	[1, 2, 3, 4, 5, 6]
    

    这虽然可行,但可读性不是很高。

  6. index
    方法 index 在列表中查找指定值第一次出现的索引。

     >>> knights = ['We', 'are', 'the', 'knights', 'who', 'say', 'ni']
     >>> knights.index('who')
     4
     >>> knights.index('herring')
     Traceback (innermost last):
     File "<pyshell>", line 1, in ?
     knights.index('herring')
     ValueError: list.index(x): x not in list
    

    搜索单词 ‘who’ 时,发现它位于索引4处。

     >>> knights[4]
     'who'
    

    然而,搜索 ‘herring’ 时引发了异常,因为根本就没有找到这个单词。

  7. insert
    方法 insert 用于将一个对象插入列表。

     >>> numbers = [1, 2, 3, 5, 6, 7]
     >>> numbers.insert(3, 'four')
     >>> numbers
     [1, 2, 3, 'four', 5, 6, 7]
    

    与 extend 一样,也可使用切片赋值来获得与 insert 一样的效果。

     >>> numbers = [1, 2, 3, 5, 6, 7]
     >>> numbers[3:3] = ['four']
     >>> numbers
     [1, 2, 3, 'four', 5, 6, 7]
    

    这虽巧妙,但可读性根本无法与使用 insert 媲美。

  8. pop
    方法 pop 从列表中删除一个元素(末尾为最后一个元素),并返回这一元素。

     >>> x = [1, 2, 3]
     >>> x.pop()
     3
     >>> x
     [1, 2]
     >>> x.pop(0)
     1
     >>> x
     [2]
    
  9. remove
    方法 remove 用于删除第一个为指定值的元素。

     >>> x = ['to', 'be', 'or', 'not', 'to', 'be']
     >>> x.remove('be')
     >>> x
     ['to', 'or', 'not', 'to', 'be']
     >>> x.remove('bee')
     Traceback (innermost last):
     File "<pyshell>", line 1, in ?
     x.remove('bee')
     ValueError: list.remove(x): x not in list
    

    如你所见,这只删除了为指定值的第一个元素,无法删除列表中其他为指定值的元素(这里是字符串 ‘bee’ )。请注意, remove 是就地修改且不返回值的方法之一。不同于 pop 的是,它修改列表,但不返回任何值。

  10. reverse
    方法 reverse 按相反的顺序排列列表中的元素(我想你对此应该不会感到惊讶)。

    >>> x = [1, 2, 3]
    >>> x.reverse()
    >>> x
    [3, 2, 1]
    

    注意到 reverse 修改列表,但不返回任何值(与 remove 和 sort 等方法一样)。

    如果要按相反的顺序迭代序列,可使用函数 reversed 。这个函数不返回列表,而是返回一个迭代器。你可使用 list 将返回的对象转换为列表。

    >>> x = [1, 2, 3]
    >>> list(reversed(x))
    [3, 2, 1]
    
  11. sort
    方法 sort 用于对列表就地排序
    ① 。就地排序意味着对原来的列表进行修改,使其元素按顺序排列,而不是返回排序后的列表的副本。

    >>> x = [4, 6, 2, 1, 7, 9]
    >>> x.sort()
    >>> x
    [1, 2, 4, 6, 7, 9]
    

    前面介绍了多个修改列表而不返回任何值的方法,在大多数情况下,这种行为都相当自然(例如,对 append 来说就如此)。需要强调 sort 的行为也是这样的,因为这种行为给很多人都带来了困惑。在需要排序后的列表副本并保留原始列表不变时,通常会遭遇这种困惑。为实现这种目标,一种直观(但错误)的方式是像下面这样做:
    >>> x = [4, 6, 2, 1, 7, 9]
    >>> y = x.sort() # Don’t do this!
    >>> print(y)
    None
    鉴于 sort 修改 x 且不返回任何值,最终的结果是 x 是经过排序的,而 y 包含 None 。为实现前述目标,正确的方式之一是先将 y 关联到 x 的副本,再对 y 进行排序,如下所示:

    >>> x = [4, 6, 2, 1, 7, 9]
    >>> y = x.copy()
    >>> y.sort()
    >>> x
    [4, 6, 2, 1, 7, 9]
    >>> y
    [1, 2, 4, 6, 7, 9]
    

    只是将 x 赋给 y 是不可行的,因为这样 x 和 y 将指向同一个列表。为获取排序后的列表的副本,另一种方式是使用函数 sorted 。

    >>> x = [4, 6, 2, 1, 7, 9]
    >>> y = sorted(x)
    >>> x
    [4, 6, 2, 1, 7, 9]
    >>> y
    [1, 2, 4, 6, 7, 9]
    

    实际上,这个函数可用于任何序列,但总是返回一个列表
    ② 。

    >>> sorted('Python')
    ['P', 'h', 'n', 'o', 't', 'y']
    

    如果要将元素按相反的顺序排列,可先使用 sort (或 sorted ),再调用方法 reverse ,也可使用参数 reverse

  12. 高级排序
    方法 sort 接受两个可选参数: key 和 reverse 。这两个参数通常是按名称指定的,称为关键字参数,将在第6章详细讨论。参数 key 类似于参数 cmp :你将其设置为一个用于排序的函数。然而,不会直接使用这个函数来判断一个元素是否比另一个元素小,而是使用它来为每个元素创建一个键,再根据这些键对元素进行排序。因此,要根据长度对元素进行排序,可将参数 key 设置为函数 len 。

    >>> x = ['aardvark', 'abalone', 'acme', 'add', 'aerate']
    >>> x.sort(key=len)
    >>> x
    ['add', 'acme', 'aerate', 'abalone', 'aardvark']
    

    对于另一个关键字参数 reverse ,只需将其指定为一个真值( True 或 False ),以指出是否要按相反的顺序对列表进行排序。

    >>> x = [4, 6, 2, 1, 7, 9]
    >>> x.sort(reverse=True)
    >>> x
    [9, 7, 6, 4, 2, 1]
    

    函数 sorted 也接受参数 key 和 reverse 。在很多情况下,将参数 key 设置为一个自定义函数很有用。

元组:不可修改的序列

元组语法很简单,只要将一些值用逗号分隔,就能自动创建一个元组。

>>> 1, 2, 3
(1, 2, 3)

如你所见,元组还可用圆括号括起(这也是通常采用的做法)。

>>> (1, 2, 3)
(1, 2, 3)

空元组用两个不包含任何内容的圆括号表示。

>>> ()
()

如何表示只包含一个值的元组

>>> 42
42
这样不是元组

>>> 42,
(42,)
>>> (42,)
(42,)
这样的才是

最后两个示例创建的元组长度为1,而第一个示例根本没有创建元组。逗号至关重要,仅将值用圆括号括起不管用: (42) 与 42 完全等效。但仅仅加上一个逗号,就能完全改变表达式的值。

>>> 3 * (40 + 2)
126
>>> 3 * (40 + 2,)
(42, 42, 42)

函数 tuple 的工作原理与 list 很像:它将一个序列作为参数,并将其转换为元组。如果参数已经是元组,就原封不动地返回它。

>>> tuple([1, 2, 3])
(1, 2, 3)
>>> tuple('abc')
('a', 'b', 'c')
>>> tuple((1, 2, 3))
(1, 2, 3)

你可能意识到了,元组并不太复杂,而且除创建和访问其元素外,可对元组执行的操作不多。元组的创建及其元素的访问方式与其他序列相同。

>>> x = 1, 2, 3
>>> x[1]
2
>>> x[0:2]
(1, 2)

元组的切片也是元组,就像列表的切片也是列表一样。为何要熟悉元组呢?原因有以下两个。

 它们用作映射中的键(以及集合的成员),而列表不行。
 有些内置函数和方法返回元组,这意味着必须跟它们打交道。只要不尝试修改元组,与元组“打交道”通常意味着像处理列表一样处理它们(需要使用元组没有的 index 和 count等方法时例外)。

一般而言,使用列表足以满足对序列的需求。

猜你喜欢

转载自blog.csdn.net/SeeUa/article/details/88553152