python列表（list）的技巧及高级操作

1、合并列表（extend）

In [1]: x=list(range(1, 13, 2))
In [2]: x + ['b', 'a']
Out[2]: [1, 3, 5, 7, 9, 11, 'b', 'a']

对于已定义的列表，可以用extend方法一次性添加多个元素：

In [7]: x2=[3, 6, 1]
In [8]: x.extend(x2)
In [9]: x
Out[9]: [1, 3, 5, 7, 9, 11, 3, 6, 1, 3, 6, 1, 3, 6, 1]

需要说明的是：加号（+）执行列表的合并是非常浪费资源的，因为必须创建一个新列表并将所有对象复制过去，而用extend将元素附加到现有列表（尤其是在构建一个大列表时）就会好很多。

因此，在进行列表合并操作时，尤其是对于大数据量的列表合并，强烈建议使用extend函数。

2、列表排序（sort）

列表的sort方法可以实现就地排序（无需创建新对象，字符串按首字母进行排序）：

In [10]: a=[1, 5, 3, -3, 0]

In [11]: a.sort()

In [12]: a
Out[12]: [-3, 0, 1, 3, 5]

In [13]: s=['a','ab','3e','z']

In [14]: s.sort()

In [15]: s
Out[15]: ['3e', 'a', 'ab', 'z']

sort有几个很好用的选项，一个是次要排序键，即一个能够产生可用于排序的值的函数。如可以通过长度对一组字符串进行排序：

In [16]: b=['a','nl','drz','mowgt','aa']

In [17]: b.sort(key=len)

In [18]: b
Out[18]: ['a', 'nl', 'aa', 'drz', 'mowgt']

再比如是否进行降序排列，如下面通过对首字母进行降序排列的示例：

In [21]: b.sort(key= lambda x:x[0], reverse=True)

In [22]: b
Out[22]: ['nl', 'mowgt', 'drz', 'a', 'aa']

3、二分搜索及维护有序列表（bisect）

内置的bisect模块实现了二分查找以及对有序列表的插入操作。bisect.bisect可以找出新元素应该被插入到哪个位置以保持元列表的有序性，bisect.insort则将新元素插入到那个正确的位置上。

In [23]: import bisect

In [24]: c=[1,2,1,-1,4,5]

In [25]: c.sort()

In [26]: bisect.bisect(c, 2)
Out[26]: 4

In [27]: bisect.insort(c, 4)

In [28]: c
Out[28]: [-1, 1, 1, 2, 4, 4, 5]

注意：bisect模块的函数不会判断原列表是否有序，因为这样做开销太大；因此将他们用作无序列表时虽然不会出错，但可能会导致不正确的结果。基于此，建议在使用bisect模块的函数前，先对原列表执行排序的操作。

3、切片（索引运算符[]及start：stop）

可以对序列类型（数组、列表、元组等）进行切片操作，start索引处元素被包括在切片的结果中，stop索引处的元素未被包括在结果中，元素数量为 stop-start。start或stop都是可以省略的，此时他们分别默认为序列的起始处和结尾处。

还可以在第二个冒号后加上步长（step），比如每隔一位取一个元素：

In [35]: d=[x for x in range(10)]

In [36]: d
Out[36]: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [37]: e=d[:8:2]

In [38]: e
Out[38]: [0, 2, 4, 6]

可以巧妙的使用 -1 ，实现对列表或元素的反序，如下：

In [40]: f=d[::-1]

In [41]: f
Out[41]: [9, 8, 7, 6, 5, 4, 3, 2, 1, 0]

4、列表内置的序列函数

4.1 enumerate

enumerate函数可以逐个返回序列的（i, value）元组，如下示例：

In [43]: #for i value in enumerate(collection):

In [44]: #用 i, value 做一些事情

In [49]: slist=['qin', 'wang', 'wqc']

In [50]: mapping = dict((v, i) for i, v in enumerate(list))

In [51]: mapping
Out[51]: {'qin': 0, 'wang': 1, 'wqc': 2}

4.2 sorted

sorted函数可以将任何序列返回为一个新的有序列表（注意：sort函数是就地排序），如下：

In [59]: sorted(['z', 'd', 'c', 'n'])
Out[59]: ['c', 'd', 'n', 'z']

In [60]: sorted('my name is chaogo')
Out[60]:
[' ',
' ',
' ',
'a',
'a',
'c',
'e',
'g',
'h',
'i',
'm',
'm',
'n',
'o',
'o',
's',
'y']

常常将sorted和set结合起来使用以得到一个由序列中的唯一元素构成的有序列表：

In [61]: set(sorted('my name is chaogo'))
Out[61]: {' ', 'a', 'c', 'e', 'g', 'h', 'i', 'm', 'n', 'o', 's', 'y'}

In [62]: sorted(set('my name is chaogo'))
Out[62]: [' ', 'a', 'c', 'e', 'g', 'h', 'i', 'm', 'n', 'o', 's', 'y']

In [63]: set('my name is chaogo')
Out[63]: {' ', 'a', 'c', 'e', 'g', 'h', 'i', 'm', 'n', 'o', 's', 'y'}

上面的结果都是一样的，什么原因呢？这是因为：（1）set和sorted是对序列进行操作，当参数不是序列时，会默认转换为列表；（2）set默认会对元素进行排序。

4.3 zip

zip用于将多个序列（列表、元组等）中的元素“配对”，从而产生一个新的元组列表；zip可以接受任意数量的序列，最终得到的元组数量由最短的序列决定；zip最常见的用法是同时迭代多个序列，还可以结合enumerate一起使用，如下：

In [77]: seq1 = ['chao', 'qing', 'wq']

In [78]: seq2 = ['qin', 'wang', 'qc']

In [79]: for i , (a,b) in enumerate(zip(seq1, seq2)):
...: print('%d: %s %s' % (i, a, b))
...:
0: chao qin
1: qing wang
2: wq qc

对于“已压缩的”（zipped）序列，zip还有一个很巧妙的用法，即对该序列进行解压（unzip，用*表示）。其实就是将一组行转换为一组列，如下：

In [86]: pitchers = [('a','b'), (1,2), ('tmd','bat')]

In [87]: one, two = zip(*pitchers)

In [88]: one
Out[88]: ('a', 1, 'tmd')

In [89]: two
Out[89]: ('b', 2, 'bat')

4.4 reversed

用于按逆序迭代序列中的元素，如下：

In [92]: [x for x in reversed([1, 2, 5, 3, -1])]
Out[92]: [-1, 3, 5, 2, 1]

python列表（list）的技巧及高级操作

猜你喜欢