1. 列表和元组的辨析

1.1 概念

相同：
区别：

1.2 操作

负数索引
切片操作
列表与元组相互转换
内置函数

1.3 列表和元组存储方式的差异

列表
元组

1.4 列表和元组的性能

从存储方式看
从资源缓存看

1.5 列表和元组的使用场景
1.5 思考题

1.1 概念

相同：

其他大部分编程语言要求集合存放的元素数据类型一致，但python中没有这样的要求，列表和元组都是可以存放任意数据类型的有序集合。（也可互相嵌套）

l = [1, 2, 'hello', 'world'] # 列表中同时含有 int 和 string 类型的元素
l
[1, 2, 'hello', 'world']

tup = ('jason', 22) # 元组中同时含有 int 和 string 类型的元素
tup
('jason', 22)

区别：

列表是动态的，长度大小不固定，可以随意地增加、删减或者改变元素（mutable）
元组是静态的，长度大小固定，无法增加删减或者改变（immutable）

若直接修改元组中的元素，则会报错
若想修改元组的元素，则必须另外开辟新的元组，复制增加元素。

tup = (1, 2, 3, 4)
new_tup = tup + (5, ) # 创建新的元组 new_tup，并依次填充两个元组的值
new _tup
==========================
(1, 2, 3, 4, 5)

1.2 操作

负数索引

python中的元组和列表都支持负数索引，即-1指向列表/元组的最末尾元素，-2指向倒数第二个，以此类推。

切片操作

l = [1, 2, 3, 4]
l[1:3] # 返回列表中索引从 1 到 2 的子列表
==========================
[2, 3]

tup = (1, 2, 3, 4)
tup[1:3] # 返回元组中索引从 1 到 2 的子元组
==========================
(2, 3)

需要注意，切片操作和range(a,b)一样，都是左闭右开区间。

列表与元组相互转换

列表和元组可以用tuple()和list()相互转换

list((1, 2, 3))
====================
[1, 2, 3]

tuple([1, 2, 3])
=====================
(1, 2, 3)

内置函数

l为列表，tup为元组

l / tup.count(x)：统计x在列表或元组中出现的次数
l / tup.index(x)：返回x在列表或元组中第一次出现时的下标
reversed() 和 sorted() ：表示对列表或元组进行倒转、排序，返回的是新开辟的倒转后、排序后的列表或元组（原来的列表或元组不变）
l.sort() | l.reverse()：表示对列表原地进行排序、转置（元组内没有内置，因其不可原地变）

1.3 列表和元组存储方式的差异

列表动态可变，元组静态不可变，这样的差异势必会影响两者的存储方式。

list和tuple的内部实现都是array的形式，list因为可变，所以是一个over-allocate的array，tuple因为不可变，所以长度大小固定。

对于保存同样元素的列表和元组l和tup，有：

l = [1, 2, 3]
l.__sizeof__()
64
tup = (1, 2, 3)
tup.__sizeof__()
48

列表

这里列表的大小比元组多了16个字节，原因如下：

列表是动态的，需要存储指针指向对应元素（这里int型，8字节）
列表可变，故需要额外存储已经分配的长度的大小（8字节），这样才能追踪列表空间的使用情况，空间不足时及时分配额外空间

对于列表，空间不足时一次性分配多个额外元素空间，即over-allocating机制，这中机制减少了每次增删操作时空间分配的开销，保证了高效性，使得增删操作都为O(1)

l = []
l.__sizeof__() // 空列表的存储空间为 40 字节
40
l.append(1)
l.__sizeof__() 
72 // 加入了元素 1 之后，列表为其分配了可以存储 4 个元素的空间 (72 - 40)/8 = 4
l.append(2) 
l.__sizeof__()
72 // 由于之前分配了空间，所以加入元素 2，列表空间不变
l.append(3)
l.__sizeof__() 
72 // 同上
l.append(4)
l.__sizeof__() 
72 // 同上
l.append(5)
l.__sizeof__() 
104 // 加入元素 5 之后，列表的空间不足，所以又额外分配了可以存储 4 个元素的空间

关于每次额外分配的空间大小，遵循以下规则：

0, 4, 8, 16, 25, 35, 46, 58, 72, 88, ...

元组

元组就像C语言的数组一样，是静态不可变的，故存储空间固定。

1.4 列表和元组的性能

从存储方式看

从两者的存储方式的区别就可以看出，在不考虑使用场景的前提下，元组更加轻量级，故性能略优于列表。

从资源缓存看

python会在后台对静态数据做一些资源缓存（resource caching），比如元组，如果它不被使用且占用空间不大时（不大于20），python就会暂时缓存这部分内存（缓存在内部一个free list）。

当下次需要定义一个同等大小的元组时，就会直接分配之前缓存的内存空间，而不再需要向操作系统发出请求分配空间，这就能大大加快程序的运行速度。

于是，初始化相同元素的列表和元组，后者比前者要快的多；
但是，对于索引操作，两者相差无几。

1.5 列表和元组的使用场景

如果存储的数据和数量不变，比如一个直接返回地点经纬度的函数，它直接传给前端渲染，那肯定选用元组更合适。

def get_location():
    ..... 
    return (longitude, latitude)

如果存储的数据或数量是变动的，比如社交平台上的一个日志功能，是统计一个用户在一周之内浏览的帖子，那肯定选用列表更合适。

viewer_owner_id_list = [] # 里面的每个元素记录了这个 viewer 一周内看过的所有 owner 的 id
records = queryDB(viewer_id) # 索引数据库，拿到某个 viewer 一周内的日志
for record in records:
    viewer_owner_id_list.append(record.id)

1.5 思考题

用如下两种方式创建空列表，哪种效率更高？

# 创建空列表
# option A
empty_list = list()

# option B
empty_list = []

list()是一个function call，Python的function call会创建stack，并且进行一系列参数检查的操作，比较expensive
[]是一个内置的C函数，可以直接被调用，因此效率高

该课程为极客时间平台上的课程，质量还是不错的，都是大牛，学生党买了几门课，但感觉还是有点小贵。。。
有需要的可以扫以下二维码参加课程，联系我（qq:510650660）把我的分享赏金和你平分，嘻嘻嘻
在这里插入图片描述

Python核心技术与实战学习笔记（一）