Redis内部涉及 的数据结构

Redis就是内存中维持一个巨大的字典,字典的key节点及value节点是一个个数据结构。

在这里简单介绍一下Redis用到的数据结构。

1.简易动态字符串(sds)

Redis没有使用传统的C字符串形式,取而代之的是自己实现了一个简单动态字符串简易动态字符串结构,简称为SDS(Simple Dynamic Strings)。

SDS兼容C字符串的同时,带来了二进制安全、计算更有效率、杜绝缓冲区溢出等优点。

struct sdshdr {
    /*字符串的长度。因为最后一个字节需为'\0',所以也是buf已经使用的空间的长度-1*/
    int len;
    /*buf中剩余可用空间的长度*/
    int free;
    /*数据空间*/
    char buf[];
};


"hello"的存储方式在内部就可能(小伙伴们考虑一下为啥是可能呢?)表示成下面的形式



2.双链表(adlist)
双链表是一个基本的数据结构,样子就像一串回形针。
Redis中的双链表跟小伙伴们在《数据结构》中学到的双链表一模一样,在此就不详细介绍了。
放个示意图



3.字典(dict)
作为key-value数据库,上面提到过整个Redis就是一个巨大的字典,字典的设计决定了此类产品的成败。

Redis的字典由字典类型特定函数和2个哈希表表组成。特定函数包括计算哈希值、复制键\值等一些列函数组成,两个哈希表用来实现渐进式 rehash。

typedef struct dict {
    /*类型特定函数组成的结构体*/
    dictType *type;
    /*私有数据*/
    void *privdata;
    /*两个哈希表*/
    dictht ht[2];
    /*是否在进行rehash中*/
    int rehashidx;
    /*目前正在运行迭代器的数量*/
    int iterators;
} dict;


哈希表hash算法采用比较流行的MurmurHash2算法,对于规律性较强的key,节点更加“分布均匀”。

用链表法处理hash碰撞,将多个哈希值相同的节点串连在一起。

渐进式 rehash是Redis字典特性,防止一次rehash导致系统资源使用增高可能导致的卡死。

非rehash时,数据会放到哈希表ht[0];rehash时,新插入的数据会放置到ht[1],同时每次字典操作都会从ht[0]移动一定数量的哈希表节点到ht[1],直到ht[0]节点数变为0,
然后执行ht[0]=ht[1],重置ht[1]。

示意图为正在rehash的字典的示意



4.跳表(skiplist)
跳表是种偷懒的设计,用来替代平衡树,跳表的算法有同平衡树一样的渐进的预期时间边界,并且更简单、更快速和使用更少的空间。
跳表是按照层级来建造的,每层皆是一个链表,上层是下层的快速跑道可以更快的定位数据所在的位置范围,查询数据时逐层定位缩小范围直至范围变为1或者0。

typedef struct zskiplistNode {
    /* 成员对象,即存储的数据*/
    robj *obj;
    /*分值,用来排序*/
    double score;
    /*后退指针,用于跳表的从尾到头的遍历*/
    struct zskiplistNode *backward;
    /*层级*/
    struct zskiplistLevel {
        /*前进指针,指向本层的下一个节点*/
        struct zskiplistNode *forward;
        /* 跨度,记录到本层下一个节点的距离*/
        unsigned int span;
    } level[];
} zskiplistNode;


各个level节点记录前进指针的同时也会记录到下一个节点的跨度,遍历跳表只需按照跨度等于1从头到尾访问节点即可。



5.压缩列表(ziplist)

压缩列表是Redis为解决内存而设计的存储方式,到满足一定的条件(如元素的个数少、key或者value的长度短)的情形下,List和字典都有可能使用压缩列表存储。

压缩列表的存储结构如下:





zlbytes 记录整个压缩表占用的字节数
zltail 记录压缩列表尾节点距离压力表第一个字节地址的偏移
zllen 表示压缩节点的个数
zlentry 为压缩表节点
zlend 压缩表结尾特殊字节,为0xFF

zlentry的结构如下

typedef struct zlentry {
    /*prevrawlen :前置节点的长度 ,prevrawlensize :编码 prevrawlen 所需的字节大小*/
    unsigned int prevrawlensize, prevrawlen;

    /*len :当前节点值的长度,lensize :编码 len 所需的字节大小*/
    unsigned int lensize, len;
    /*当前节点 header 的大小,等于 prevrawlensize + lensize*/
    unsigned int headersize;
    /*当前节点存储何种类型的数据*/
    unsigned char encoding;
    /*数据指针*/
    unsigned char *p;

} zlentry;



6.整数集合(intset)

当集合中只有整数时,Redis会使用下面的结构来存储这些整数。

typedef struct intset {
    /*编码方式*/
    uint32_t encoding;
    /*包含的元素个数*/
    uint32_t length;
    /*集合中的元素,会根据编码方式来决定一个元素占用多少个字节*/
    int8_t contents[];
} intset;





猜你喜欢

转载自orangeholic.iteye.com/blog/2236051