数据结构与算法——线性表

1.概念

线性表可以看做一种抽象的概念,也可以作为一种抽象数据类型,一个线性表是某类元素的集合,还记录着元素之间的一种顺序关系。相当于一个抽象类,只做定义。

2.具体实现

1.顺序表

顺序表的基本实现方式非常简单:表中元素顺序存放在一片足够大的连续储存区间里,首元素存入储存区的开始位置,其余元素依次顺序存放,元素之间的逻辑关系通过元素在储存区里的物理位置表示(隐式表示元素之间的关系)

顺序表在内存中的布局方式:

1.顺序表基本操作的实现

  1. 创建和访问操作

创建空表时,需要分配一块元素储存,记录表的容量,并将元素计数设置为0,复杂度为O(1)

  1. 简单判断操作

判断表空或表满的操作很容易实现,复杂度都为O(1)

  1. 访问给定下标i的元素

不依赖表中元素个数,因此也是O(1)操作

  1. 遍历操作

要顺序访问表中元素,在遍历过程中记录遍历到达位置,再算出元素位置,即可获取到元素。获取每一个元素的复杂度为O(1),所以遍历整个表的复杂度为O(n)。

  1. 查找给定元素d的位置

这种操作称为检索或查找,采用遍历的操作,顺序比较,时间复杂度O(n)。

  1. 查找给定元素d在位置k之后第一次出现的位置

同5相同,只不过从位置k以后遍历。

  1. 加入元素

在表的尾端加入和删除都很简单,时间复杂度为O(1)。在其他位置添加和删除就要麻烦些,需要移动操作位置后面的数据,向前移动或向后移动,时间复杂度为O(len-i),i为操作位置。

  1. 删除元素

尾端删除元素操作简单,时间复杂度为O(1),一般位置删除O(n),基于条件的删除O(n)。

总结:

优点:O(1)时间的按位置访问,元素在表里储存紧凑,除表元素外,只需要O(1)空间存放少量的辅助信息。

缺点:需要连续的储存区存放表中元素,如果表很大,就需要大片的连续内存空间,一旦确定了储存块的大小,不会随着数据的插入和删除操作进行变动,会有大量空闲单元存在,造成浪费。

2.顺序表的结构

两种基本实现方式

    1. 一体式结构
    2. 分离式结构

  1. 一体式分析

实现比较紧凑,有关信息集中在一起,整体性强,易于管理。

创建后储存区大小固定

  1. 分离式分析

表中只保存于整个表有关的信息,实际元素放在另一个独立的元素储存区对象里,通过链接于基本表对相关连,这样的表对象大小统一,但一个表需要两个独立的对象实现,创建和管理工作复杂。分离式实现的最大优点是带来了一种新的可能,可以在标识不变的情况下,为其对象换一块元素储存区,也就是说可以改变表的容量。

      • 另外申请一块更大的存储区
      • 把表中已有元素复制到新存储区
      • 用新的元素存储区替换原来的元素存储区
      • 实际加入新元素

在扩容的时候如果每次只扩大10个元素储存位置,那么在大量数据插入的时候,需要不停的更换存储位置,元素频繁复制迁移。如果每次扩大当前储存量的一倍,当数据较大的时候,会造成大量的存储空间浪费。所以扩容的时候采用的策略也需要权衡利弊。

3.python的list

基本实现

    1. 基于下标高效访问和更新
    2. 允许任意加入元素,而且在加入过程中表的id不变

解决方案

    1. 由于需要O(1)时间的元素访问,并能维持元素的顺序,这种表只能采用连续表技术
    2. 要求容纳任意多的元素,就必须能更换元素存储区,所以只能采用分离式技术实现。

实际策略

    1. 在建立空表或很小的表时,系统分配一块能容纳8个元素的存储区,如果满了就换一块4倍大的存储区
    2. 如果表的容量达到50000时,换储存区时容量加倍

4.顺序表的简单总结

  1. 最重要的特点是O(1)时间的定位元素访问,更新。很多简单操作的效率也比较高。
  2. 最麻烦的是加入,删除等操作的效率问题
  3. 需要连续的存储空间
  4. 结构不够灵活

2.链接表

    1. 单链表

在这样的结构中,为了掌握一个表,只需要用一个变量保存着这个表的首节点的引用

    • 一个单链表由一些具体的表节点构成
    • 每个节点是一个对象,有自己的标识,也称为该节点的链接
    • 节点之间通过链接建立起单向的顺序联系
    • 链表的结束只需在最后的节点的链接域设置一个None。
2.1.1. 基本操作
    • 创建空链表:只需要把相应的表头变量设置为空链接。
    • 删除链表:丢弃这个链表里的所有节点,python里只需要将表指正赋值为None,python解释器会自动回收不用的存储。
    • 判断是否为空:将表头变量的值与空链接值比较
    • 判断是否满:一般而言链表不会满,除非程序用完了所有的存储空间
    • 首端插入:
      • 创建一个新节点并存入数据
      • 把原链表首节点的链接存入新节点的链接域next
      • 修改表头变量,使之指向新节点
    • 一般情况下的插入
      • 找到插入位置
      • 执行首端操作的三步
    • 删除表首元素:只需修改表头指针,令其指向第二个节点
    • 一般情况下的删除:找到元素前一节点所在位置,next域改为元素后一节点的链接
    • 扫描、定位和遍历:由于单链表只有一个方向的链接,开始时只有表头的链接在掌握中,所以对表内内容的一切检查都只能从表头开始,沿表中链接逐步进行,过程称为扫描。
      • 按下标定位
      • 按元素定位
    • 操作复杂度
      • 创建空表:O(1)
      • 删除表:在python里是O(1)
      • 判断空:O(1)
      • 加入元素或删除:
      • 首端加入:O(1)
      • 尾端加入:O(n)
      • 随意加入:O(n),平均和最坏情况都是
      • 求表的长度:需要扫描整个,得出长度,也可以把长度记录为表的数据成分,O(1)

 

猜你喜欢

转载自www.cnblogs.com/jiaojianglong/p/11260919.html