Python中的列表、元组到底是个啥?

前言

数据结构入门后第一个接触到的应该就是顺序表了,顺序表应该还是比较好实现的,将元素顺序地存放在一块连续的存储区里,元素间的顺序关系由它们的存储顺序自然表示。顺序表的使用好处在于物理存储上是一连串相邻的地址,当你的第一个元素唯一确定存储地址之后,后面的元素就可以顺着找到且不需要什么特别的操作。其实查阅官方文档就可以发现,Python中的列表等高级数据类型就是用顺序表来实现的,这就更加体现了数据结构的语言无关性。

顺序表的基本形式

在这里插入图片描述
图a是顺序表的基本实现形式,可以看到其数据元素是连续存储,每个数据占用相同大小的存储空间,元素的下标是其逻辑地址,而元素存储的物理地址(实际内存地址)可以通过存储区的起始地址Loc (e0)加上逻辑地址(第i个元素)与存储单元大小(c)的乘积计算而得,即:
Loc(ei) = Loc(e0) + c*i
因此,顺序表无需从头开始一个一个的遍历,只要知道首地址和一个元素占用的存储空间就可以计算得到其他元素的地址。
这种方式存储有其好处也有不足,不足在于存储不同数据类型的元素时,单一的相同的存储空间可能会使某个数据存不进去也有可能造成空间的浪费。像Python中的列表是可以存储不同数据类型的元素的,这就说明顺序表有其他的存储方式,就像是图b所示的元素外置的顺序表。
何为元素外置?简单来说就是要存储的数据元素单独存储,顺序表还是那个顺序表,只不过在顺序表中存储的东西现在变成了原先要放在这里的数据的地址,然后我们通过这个地址来找到这个数据元素。打个比方就是说哈,咱们一个班里有好多个人,每个人的名字字数不同是吧,有的人两个,有的人三个,还有四个五个的…我们要是直接用顺序表存他们名字的话,字数不同,空间不好统一,但是他们每个人的学号的存储空间是一样的吧,我们就按照顺序表存储他们的学号,然后同个学号链接到每一个人的名字。

顺序表的结构与实现

顺序表的结构

在这里插入图片描述
一个顺序表的完整信息包括两部分,一部分是表中的元素集合,另一部分是为实现正确操作而需记录的信息,即有关表的整体情况的信息,这部分信息主要包括元素存储区的容量和当前表中已有的元素个数两项。

顺序表的实现

顺序表的两种基本实现方式
在这里插入图片描述
图a为一体式结构,存储表信息的单元与元素存储区以连续的方式安排在一块存储区里,两部分数据的整体形成一个完整的顺序表对象。一体式结构的好处在于整体性强,易于管理,但是由于数据元素存储区域是表对象的一部分,顺序表创建后,元素存储区就固定了。后面想要添加元素的话就受限于存储空间的大小。
图b为分离式结构,表对象里只保存与整个表有关的信息(即容量和元素个数),实际数据元素存放在另一个独立的元素存储区里,通过链接与基本表对象关联。这种方式就解决了上面一体式存储的问题,分离式结构对元素的修改就比较方便。
一体式结构由于顺序表信息区与数据区连续存储在一起,所以若想更换数据区,则只能整体搬迁,即整个顺序表对象(指存储顺序表的结构信息的区域)改变了。
分离式结构若想更换数据区,只需将表信息区中的数据区链接地址更新即可,而该顺序表对象不变。
采用分离式结构的顺序表,若将数据区更换为存储空间更大的区域,则可以在不改变表对象的前提下对其数据存储区进行了扩充,所有使用这个表的地方都不必修改。只要程序的运行环境(计算机系统)还有空闲存储,这种表结构就不会因为满了而导致操作无法进行。人们把采用这种技术实现的顺序表称为动态顺序表,因为其容量可以在使用中动态变化。
当然我们的元素扩充也是要讲策略的:
每次扩充增加固定数目的存储位置,如每次扩充增加10个元素位置,这种策略可称为线性增长。线性扩充可以节省空间,但是扩充操作频繁,操作次数多。
每次扩充容量加倍,如每次扩充增加一倍存储空间。倍数扩充减少了扩充操作的执行次数,但可能会浪费空间资源。以空间换时间,是推荐的方式。

顺序表的操作

增加元素

在这里插入图片描述a. 尾端加入元素,时间复杂度为O(1)
b. 非保序的加入元素(不常见),时间复杂度为O(1)
c. 保序的元素加入,时间复杂度为O(n)

删除元素

在这里插入图片描述
a. 删除表尾元素,时间复杂度为O(1)
b. 非保序的元素删除(不常见),时间复杂度为O(1)
c. 保序的元素删除,时间复杂度为O(n)

具体可见我的前一篇博文列表的操作。

Python中的顺序表

前面就说了列表是Python中的一种顺序表,元组也是,不过元组是不可变顺序表,不能执行改变元素的操作,其他的性质跟列表是一样的。

在Python的官方实现中,list就是一种采用分离式技术实现的动态顺序表。这就是为什么用list.append(x) (或 list.insert(len(list), x),即尾部插入)比在指定位置插入元素效率高的原因。
在Python的官方实现中,list实现采用了如下的策略:在建立空表(或者很小的表)时,系统分配一块能容纳8个元素的存储区;在执行插入操作(insert或append)时,如果元素存储区满就换一块4倍大的存储区。但如果此时的表已经很大(目前的阀值为50000),则改变策略,采用加一倍的方法。引入这种改变策略的方式,是为了避免出现过多空闲的存储位置。

最后

图片来源于我学习的资料!接下来就要接触到链表了啊,一想到C语言中的指针就脑壳痛,不知道Python是如何解决的呢?欢迎关注我的下一篇博客!
湖北新增确诊为0了!今天才知道,开学的日子应该就不远了叭,武汉加油!!!

发布了18 篇原创文章 · 获赞 98 · 访问量 9212

猜你喜欢

转载自blog.csdn.net/qq_43779324/article/details/104990688