极客算法03 | 链表

版权声明:本文为博主原创文章,转载请附上博文链接! https://blog.csdn.net/weixin_40862011/article/details/88222780

一、什么是链表?

  1. 和数组一样,链表也是一种线性表。
  2. 从内存结构来看,链表的内存结构是不连续的内存空间,它是一种通过指针将一组零散的内存块串联起来,从而进行数据存储的数据结构。
  3. 链表中的每一个内存块被称为节点Node。节点除了存储数据外,还需记录链上下一个节点的地址,即后继指针next。

二、为什么使用链表?即链表的特点

  1. 插入、删除数据效率高,O(1)级别(  只需更改指针指向即可),随机访问效率低,O(n)级别(需要从链头至链尾进行遍历)。
  2. 和数组相比,内存空间消耗更大,因为每个存储数据的节点都需要额外的空间存储后继指针。

三、常用链表:单链表、循环链表和双向链表 

1.单链表

  • 每个节点只包含一个指针,即后继指针。
  • 单链表有两个特殊的节点,即首节点和尾节点。为什么特殊?用首节点地址表示整条链表,尾节点的后继指针指向空地址null。
  • 性能特点:插入和删除节点的时间复杂度为O(1),查找的时间复杂度为O(n)。

2.循环链表

  • 除了尾节点的后继指针指向首节点的地址外均与单链表一致。
  • 适用于存储有循环特点的数据,比如约瑟夫问题。

3.双向链表

  • 节点除了存储数据外,还有两个指针分别指向前一个节点地址(前驱指针prev)和下一个节点地址(后继指针next)。
  • 首节点的前驱指针prev和尾节点的后继指针均指向空地址。
  • 性能特点:
  1. 和单链表相比,存储相同的数据,需要消耗更多的存储空间。
  2. 插入、删除操作比单链表效率更高,O(1)级别。以删除操作为例,删除操作分为2种情况:给定数据值删除对应节点和给定节点地址删除节点。对于前一种情况,单链表和双向链表都需要从头到尾进行遍历从而找到对应节点进行删除,时间复杂度为O(n)。对于第二种情况,要进行删除操作必须找到前驱节点,单链表需要从头到尾进行遍历直到p->next = q,时间复杂度为O(n),而双向链表可以直接找到前驱节点,时间复杂度为O(1)。
  3. 对于一个有序链表,双向链表的按值查询效率要比单链表高一些。因为我们可以记录上次查找的位置p,每一次查询时,根据要查找的值与p的大小关系,决定是往前还是往后查找,所以平均只需要查找一半的数据。
  4. 实际的软件开发中,双向链表尽管比较费内存,但还是比单链表的应用更加广泛, Java 语言 中LinkedHashMap 这个容器底层就用到了双向链表。

4.双向循环链表

  • 首节点的前驱指针指向尾节点,尾节点的后继指针指向首节点。

四、选择数组还是链表?

1.插入、删除和随机访问的时间复杂度

  • 数组:插入、删除的时间复杂度是O(n),随机访问的时间复杂度是O(1)。
  • 链表:插入、删除的时间复杂度是O(1),随机访问的时间复杂端是O(n)。

2.数组缺点

  • 若申请内存空间很大,比如100M,但若内存空间没有100M的连续空间时,则会申请失败,尽管内存可用空间超过100M。
  • 大小固定,若存储空间不足,需进行扩容,一旦扩容就要进行数据复制,而这是非常费时的

3.链表缺点

  • 内存空间消耗更大,因为需要额外的空间存储指针信息。
  • 对链表进行频繁的插入和删除操作,会导致频繁的内存申请和释放,容易造成内存碎片。如果是Java语言,还可能会造成频繁的GC(自动垃圾回收器)操作。

4.如何选择?

  • 数组简单易用,在实现上使用连续的内存空间,可以借助CPU的缓冲机制预读数组中的数据,所以访问效率更高,而链表在内存中并不是连续存储,所以对CPU缓存不友好,没办法预读
  • CPU缓存存在的意义:为了弥补内存访问速度过慢与CPU执行速度快之间的差异而引入。对于数组来说,存储空间是连续的,所以在加载某个下标的时候可以把以后的几个下标元素也加载到CPU缓存,这样执行速度会快于存储空间不连续的链表存储。
  • 如果代码对内存的使用非常苛刻,那数组就更适合。

五、应用

问题1.如何分别用链表和数组实现LRU缓存淘汰算法?

1.1什么是缓存?

  • 缓存是一种提高数据读取性能的技术,在硬件设计、软件开发中都有着非广泛的应用,比如常见的CPU缓存、数据库缓存、浏览器缓存等等。

1.2为什么使用缓存?即缓存的特点

  • 缓存的大小是有限的,当缓存被用满时,哪些数据应该被清理出去,哪些数据应该被保留?就需要用到缓存淘汰策略来决定。

1.3什么是缓存淘汰策略?

  • 指的是当缓存被用满时清理数据的优先顺序。

1.4有哪些缓存淘汰策略?

  • 常见的3种包括先进先出策略FIFO(First In,First Out)、最少使用策略LFU(Least Frenquently Used)、最近最少使用策略LRU(Least Recently Used)。

1.5链表实现LRU缓存淘汰策略

  1. 如果此数据之前已经被缓存在链表中了,我们遍历得到这个数据对应的结点,并将其从原来的位置删除,然后再插入到链表的头部。
  2. 如果此数据没有在缓存链表中,又可以分为两种情况:
  • 如果此时缓存未满,则将此结点直接插入到链表的头部;
  • 如果此时缓存已满,则链表尾节点删除,将新的数据结点插入到链表的头部。

1.6数组实现LRU缓存淘汰策略(数据量大时,数据迁移带来耗时)

  • 方式一:首位置保存最新访问数据,末尾位置优先清理
  • 当访问的数据未存在于缓存的数组中时,直接将数据插入数组第一个元素位置,此时数组所有元素需要向后移动1个位置,时间复杂度为O(n);当访问的数据存在于缓存的数组中时,查找到数据并将其插入数组的第一个位置,此时亦需移动数组元素,时间复杂度为O(n)。缓存用满时,则清理掉末尾的数据,时间复杂度为O(1)。
  • 方式二:首位置优先清理,末尾位置保存最新访问数据
  • 当访问的数据未存在于缓存的数组中时,直接将数据添加进数组作为当前最有一个元素时间复杂度为O(1);当访问的数据存在于缓存的数组中时,查找到数据并将其插入当前数组最后一个元素的位置,此时亦需移动数组元素,时间复杂度为O(n)。缓存用满时,则清理掉数组首位置的元素,且剩余数组元素需整体前移一位,时间复杂度为O(n)。(优化:清理的时候可以考虑一次性清理一定数量,从而降低清理次数,提高性能。)

问题2.如何通过单链表实现“判断某个字符串是否为回文字符串"?

  1. 前提:字符串以单个字符的形式存储在单链表中。
  2. 用快慢指针法找到中点,把后半段链表逆转。
  3. 指针一个在头,一个在中点。
  4. 同步遍历2部分链表,比较对应的字符是否相等,若相等,则是回文字符串,否则,不是。

六、设计思想

  • 时空替换思想:“用空间换时间” 与 “用时间换空间”
  • 当内存空间充足的时候,如果我们更加追求代码的执行速度,我们就可以选择空间复杂度相对较高,时间复杂度小相对较低的算法和数据结构,缓存就是空间换时间的例子。
  • 相反,如果内存比较紧缺,比如代码跑在手机或者单片机上,这时,就要反过来用时间换空间的思路。
  • 对于执行较慢的程序,可以通过消耗更多的内存(空间换时间)来进行优化。
  • 而消耗过多内存的程序,可以通过消耗更多的时间(时间换空间)来降低内存的消耗。

七、优雅写出链表代码

  • 技巧一:理解指针或引用的含义:将某个变量赋值给指针,实际上就是将这个变量的地址赋值给指针,或者反过来说,指针中存储了这个变量的内存地址,指向了这个变量,通过指针就能找到这个变量。
  • 技巧二:警惕指针丢失和内存泄漏:插入结点时,一定要注意操作的顺序;删除链表结点时,也一定要记得手动释放内存空间。
  • 技巧三:利用哨兵简化实现难度:针对链表的插入、删除操作,需要对插入第一个结点和删除最后一个结点的情况进行特殊处理,因此引入“哨兵”节点来解决这个问题。哨兵最大的作用就是简化边界条件的处理。
  • 技巧四:重点留意边界条件处理
  1. 如果链表为空时,代码是否能正常工作?
  2. 如果链表只包含一个节点时,代码是否能正常工作?
  3. 如果链表只包含两个节点时,代码是否能正常工作?
  4. 代码逻辑在处理头尾节点时是否能正常工作?
  • 技巧五:举例画图,辅助思考

猜你喜欢

转载自blog.csdn.net/weixin_40862011/article/details/88222780