redis sort set2

「这是我参与2022首次更文挑战的第28天，活动详情查看：2022首次更文挑战」。

2.1 跳跃表的形成过程

通过上文我们认识到了一个单链表的结构，并通过分析插入、查询得知他们的时间复杂度都是O(N)，如果我们想降低时间复杂度，我们需要怎么做呢？

第一种：转换为哈希表，第二种：转换成平衡树，第三种：转换为B-树，但是这些数据结构都有其不合适的地方(后续3.9章节会有跟各个数据结构的对比情况)，如果我们就是希望以链表为基础的数据结构，有其他的合适的数据结构吗？

答案是有的，首先我们回想一下我们的书的目录的结构，下面是(图2.0)是时间简史的目录，假如我们想看黑洞这章节，我们能够很容易知道从267页开始就是讲的黑洞，我们也能够很容易的知道第302页就是第八章宇宙的起源和命运的开始，这其实是我们提前把章节打上了一个索引。

book-list

那对于链表呢？我们也可以给它加一下索引来提高我们的查询效率。假如我们现在有一个有序链表，其元素为1、3、5、7、10、12、15、19，我们可以在链表的基础上，每两个结点提取一个结点作为索引，在通过索引层的结点去原始链表去找元素，如图2.1**：

skiplist

这样我们找一个数字12，没有索引的流程是1 -> 3 -> 5 -> 7 -> 10 -> 12返回，现在的流程是从一级索引开始查：1 -> 5 -> 10 -> 12，查询次数从6次减少到了4次，甚至我们还可以再基于一级索引每两个结点再提取一个结点作为二级索引，如图2.1：

skip-list-two-level

这样我们找一个数字12，流程是: 1 -> 10 -> 12，查询次数从4次减少到了3次，不过我们的数据量现在只有 8 个元素，假如说我们有几千个元素那查询效果就非常明显了。像这种在原来有序链表的基础上增加了多级索引来提高查询效率数据结构，我们称之为跳表，也叫跳跃表，哪不知道大家有没有一个疑问，我们怎么去确定我们有多少级的索引(后见章节3.2)？我们跳表的查询，插入时间复杂度是怎么样的呢？下面我们先推导一下跳表的时间复杂度。