数据库中为什么用B+树数据结构实现索引而不是用B-树(个人的理解)

一个m阶的B树具有如下几个特征:

1.根结点至少有两个子女。

2.每个中间节点都包含k-1个元素和k个孩子,其中 m/2 <= k <= m

3.每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m

4.所有的叶子结点都位于同一层。

5.每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划。

一个m阶的B+树具有如下几个特征:

1.有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。

2.所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。

3.所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。

B+树中没有卫星数据:(所谓卫星数据就是索引元素指向的数据记录,比如数据库中的某一行,在B-树中无论中间节点还是叶子节点都有卫星数据)

B-树中的卫星数据

B+树中的卫星数据 

需要补充的是,在数据库的聚集索引(Clustered Index)中,叶子节点直接包含卫星数据。在非聚集索引(NonClustered Index)中,叶子节点带有指向卫星数据的指针。

B+树查询性能的体现: 

我们通过单行查询和范围查询来说明:

1.在单行查询中B+树会自顶向下逐层查找,直到找到匹配的叶子节点。

体现:看似和B-树差不多,B+树中的节点没有卫星数据,同样大小的磁盘页可以容纳更多的节点元素。意味着数据量相同的情况下,B+树的数据结构更加矮胖,因此IO次数也更少。

再者,B+数每次查询都是查到叶子节点,而B-数据只需要找到元素即可,无论是叶子结点还是非叶子节点。所以说B+树的查询性能稳定,而B-树的查询性能不稳定。

2. B-树的范围查找过程

提现:B-树只能依靠繁琐的中序遍历操作,而B+树只需遍历有序的链表即可。

总结:

B+树的IO次数少       查询稳定     范围查询简便。

B+树的特征:

1.有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。

2.所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。

3.所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。

B+树的优势:

1.单一节点存储更多的元素,使得查询的IO次数更少。

2.所有查询都要查找到叶子节点,查询性能稳定。

3.所有叶子节点形成有序链表,便于范围查询。

参考链接:

https://www.sohu.com/a/156886901_479559

猜你喜欢

转载自blog.csdn.net/qfc8930858/article/details/89435416