python——列表和元组性能对比

创建列表方式

# 创建空列表
# option A
empty_list = list()

# option B
empty_list = []

区别主要在于 list() 是一个 function call,Python 的 function call 会创建 stack,并且进行一系列参数检查的操作,开销较大,反观 [] 是一个内置的 C 函数,可以直接被调用,因此效率高。

列表和元组存储方式的差异

列表和元组最重要的区别就是,列表是动态的、可变的,而元组是静态的、不可变的。这样的差异势必会影响两者存储方式:

list1 = [1, 2, 3]
list1.__sizeof__() # 分配的空间
64
tup1 = (1, 2, 3)
tup1.__sizeof__()
48

可见,对列表和元组,我们放置了相同的元素,但元组的存储空间却比列表要少16字节。

事实上,由于列表是动态的,所以它需要存储指针,来指向对应的元素(上述例子中,对于 int 型,8 字节)。另外,由于列表可变,所以需要额外存储已经分配的长度大小(8 字节),这样才可以实时追踪列表空间的使用情况,当空间不足时,即使分配额外空间。

l = []
l.__sizeof__() # 空列表的存储空间为 40 字节
40
l.append(1)
l.__sizeof__() # 加入了元素 1 之后,列表为其分配了可以存储 4 个元素的空间(72 - 40)/ 8 = 4
72
l.append(2)
l.__sizeof__() # 由于之前分配了空间,所以加入元素 2,列表空间不变
72
l.append([3, 4])
l.__sizeof__()
72
l.append(5)
l.__sizeof__() # 加入元素 5 之后,列表的空间不足,所以又额外分配了可以存储 4 个元素的存储空间
104

为了减小每次增加/删减操作时空间分配的开销, Python每次分配空间时都会额外多分配一些,这样的机制( over- allocating)保证了其操作的高效性:增加/删除的时间复杂度均为 O(1)。

但是对于元组,情况就不同了。元组长度大小固定,元素不可变,所以存储空间固定。

列表和元组的性能

元组要比列表更加轻量级一些,所以总体上来说,元组的性能速度要略优于列表。

另外,Python 会在后台,对静态数据做一些资源缓存(resource caching)。通常来说,因为垃圾回收机制的存在,如果一些变量不被使用了,Python 就会回收它们所占用的内存,返还给操作系统,以便其他变量或其他应用使用。

扫描二维码关注公众号,回复: 10187935 查看本文章

但是对于一些静态变量,比如元组,如果它不被使用并且占用空间不大时,Python 会暂时缓存这部分内存。这样,下次我们再创建同样大小的元组时,Python 就可以不用再向操作系统发出请求,去寻找内存,而是可以直接分配之前缓存的内存空间,这样就能大大加快程序的运行速度。

下面的例子,是计算初始化一个相同元素的列表和元组分别所需的时间。可以看到,元组的初始化速度,要比列表快 5 倍。

import timeit
t1 = timeit.Timer('x=[1, 2, 3, 4, 5, 6]')
t1.timeit()
0.07322828826904981
t2 = timeit.Timer('x=(1, 2, 3, 4, 5, 6)')
t2.timeit()
0.01978216423486856

如果是索引操作的话,两者的速度差别非常小,几乎可以忽略不计。

t11 = timeit.Timer('y=x[3]', 'x=[1, 2, 3, 4, 5, 6]')
t11.timeit()
0.03726485971640159
t22 = timeit.Timer('y=x[3]', 'x=(1, 2, 3, 4, 5, 6)')
t22.timeit()
0.03577006133559735

列表和元组的使用场景

  1. 如果存储的数据和数量不变,比如你有一个函数,需要返回的是一个地点的经纬度,然后直接传给前端渲染,那么肯定选用元组更合适。
def get_location():
    ......
    return (longitude, latitude)
  1. 如果存储的数据或数量是可变的,比如社交平台上的一个日志功能,是统计一个用户在一周之内看了哪些用户的帖子,那么则用列表更合适。
viewer_owner_id_list = [] # 里面的每个元素记录了这个 viewer 一周内看过的所有 owner 的 id
records = queryDB(viewer_id) # 索引数据库,拿到某个 viewer 一周内的日志
for record in records:
    viewer_owner_id_list.append(record.id)
  1. 元素不需要改变时:
    两三个元素,使用 tuple,元素多一点使用 namedtuple。

  2. 元素需要改变时:
    需要高效随机读取,使用 list。需要关键字高效查找,采用 dict。去重,使用 set。大型数据节省空间,使用标准库 array。大型数据高效操作,使用 numpy.array。

总结

列表和元组都是有序的(可通过下标检索),可以存储任意数据类型的集合,主要有以下区别:

  • 列表是动态的,长度可变,可以随意地增删改元素。列表的存储空间略大于元组,性能略逊于元组。
  • 元组是静态的,长度大小固定,不可以对元组元素进行增删改操作。元组对于列表更加轻量级,性能稍优。
发布了26 篇原创文章 · 获赞 22 · 访问量 2万+

猜你喜欢

转载自blog.csdn.net/Run_Bomb/article/details/91380795