语法:
list.sort(func=None, key=None, reverse=False)
cmp -- 可选参数, 如果指定了该参数会使用该参数的方法进行排序;
key -- 用来在进行比较之前指定每个列表元素上要调用的函数,指定可迭代对象中的一个元素来进行排序;
reverse -- 排序规则,reverse = True 降序, reverse = False 升序(默认);
sorted(iterable, key=None, reverse=False)
iterable -- 可迭代对象;
sort 和sorted 的区别:
- sorted()不会改变原来的list,返回一个新的已经排好序的list,而sort()返回值为None;
- list.sort()方法仅仅被list所定义,sorted()可用于任何一个可迭代对象;
#区分大小写的字符串比较排序
>>> sorted("This is a test string from Andrew".split(), key=str.lower)
['a', 'Andrew', 'from', 'is', 'string', 'test', 'This']
>>> student_tuples = [
('john', 'A', 15),
('jane', 'B', 12),
('dave', 'B', 10),
]
>>> sorted(student_tuples, key=lambda student:student[2]) # sort by age
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
#先排序列表list中元素的第一个关键字,然后在第一个元素的基础上排序按第二个关键字进行排序:
>>> list = [('d',3),('a',5),('d',1),('c',2),('d',2)]
>>> print sorted(list, key = lambda x:(x[0],x[1]))
[('a', 5), ('c', 2), ('d', 1), ('d', 2), ('d', 3)]
Operator Module Functions
这个操作模块有:
operator.itemgetter() ----- 通过下标
operator.attrgetter() ----- 通过参数
operator.methodcaller() ----- python 2.5 被引入,下文详细介绍
使用这几个函数,对于上面 Key Function 的例子处理起来将会更加的简便和快速.
先一起介绍 operator.itemgetter() 和 operator.attrgetter() ,会更加容易理解:
>>> from operator import itemgetter, attrgetter
>>> sorted(student_tuples, key=itemgetter(2))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)]
>>> sorted(student_objects, key=attrgetter('age'))
[('dave', 'B', 10), ('jane', 'B', 12), ('john', 'A', 15)
这个操作模块也允许多层次的进行排序,例如可以先排序 “成绩grand” 再排序 “年龄age”
>>> sorted(student_tuples, key=itemgetter(1,2))
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]
>>> sorted(student_objects, key=attrgetter('grade', 'age'))
[('john', 'A', 15), ('dave', 'B', 10), ('jane', 'B', 12)]
>>> list = [('d',3),('a',5),('d',1),('c',2),('d',2)]
>>> from operator import itemgetter
>>> sorted(list, key=itemgetter(0,1))
[('a', 5), ('c', 2), ('d', 1), ('d', 2), ('d', 3)]
但是还是推荐key function 中的方法,因为为了这一个排序而引入一个库文件,相对来说得不偿失。
operator.methodcaller() 函数:
这个函数是对某个对象的使用固定参数进行排序,例如:str.count() 函数可以计算每个字符串对象中含有某个参数的个数,那运用这个函数我就可以通过 str.count() 计算出某个字符的个数从而来确定排序的优先级:
>>> from operator import methodcaller
>>> messages = ['critical!!!', 'hurry!', 'standby', 'immediate!!']
>>> sorted(messages, key=methodcaller('count', '!'))
['standby', 'hurry!', 'immediate!!', 'critical!!!']
根据字符串中的数字排序,如f10应该在f2后面
#encoding=utf-8
print '中国'
#根据字符串中的数字排序,如f10应该在f2后面
import re
re_digits = re.compile(r'(\d+)')
def emb_numbers(s):
pieces=re_digits.split(s)
pieces[1::2]=map(int,pieces[1::2])
return pieces
def sort_strings_with_emb_numbers(alist):
aux = [(emb_numbers(s),s) for s in alist] #[(['file',1,'.txt'],'file1.txt')]
aux.sort()
return [s for __,s in aux] #提取元组中第二个元素,比如'file1.txt'
def sort_strings_with_emb_numbers2(alist):
return sorted(alist, key=emb_numbers)
filelist='file10.txt file2.txt file1.txt'.split()
print filelist
print '--DSU排序'
print sort_strings_with_emb_numbers(filelist)
print '--内置DSU排序'
print sort_strings_with_emb_numbers2(filelist)
中国
['file10.txt', 'file2.txt', 'file1.txt']
--DSU排序
['file1.txt', 'file2.txt', 'file10.txt']
--内置DSU排序
['file1.txt', 'file2.txt', 'file10.txt']