什么是B+树。B+树的插入。B+树的删除。B+树和B-树的区别。

目录

一.B+树的概述

二.B+树的插入操作

三.B+树的删除操作

四.B+树的特点

五.为什么说B+树比B树更适合数据库索引?

六.B+树的应用


一.B+树的概述

B+树是B树的一种变形形式,B+树上的叶子结点存储关键字以及相应记录的地址,叶子结点以上各层作为索引使用。一棵m阶的B+树的特征与B树大同小异,但是有以下几点需注意:

  • 有m个子树的中间节点必有m个元素(B树中是m-1个元素),但每个元素不保存数据,只用来索引;
  • 所有的叶子结点中包含了全部关键字的信息,及指向含有这些关键字记录的指针,且叶子结点本身依关键字的大小自小而大的顺序链接。 (而B 树的叶子节点并没有包括全部需要查找的信息);
  • 所有的非终端结点可以看成是索引部分,结点中仅含有其子树根结点中最大(或最小)关键字。 (而B 树的非终节点也包含需要查找的有效信息);
  • B+树的查找与B树不同,当索引部分某个结点的关键字与所查的关键字相等时,并不停止查找,应继续沿着这个关键字左边的指针向下,一直查到该关键字所在的叶子结点为止。 

B+树的特征:

  • 有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。
  • 所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。
  • 所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。

例如下图所示的一个4阶B+树 

 

二.B+树的插入操作

现有一个如下图所示的B+树

现在我们要将54插入

 

我们接着再插入9和13

插入40

插入43后

插入44

三.B+树的删除操作

删除1

删除44

删除50

删除40

更多的插入或者删除的情况大家可以自行在这个网站中去学习:

https://www.cs.usfca.edu/~galles/visualization/BPlusTree.html 

四.B+树的特点

这个特点是在索引之外,确是至关重要的特点。那就是[卫星数据]的位置。所谓卫星数据,指的是索引元素所指向的数据记录,比如数据库中的某一行。在B-树中,无论中间节点还是叶子节点都带有卫星数据。而在B+树当中,只有叶子节点带有卫星数据,其余中间节点仅仅是索引,没有任何数据关联。

B-树中的卫星数据(Satellite Information):

B+树中的卫星数据(Satellite Information):

B+树设计成这样的好处首先,B+树的中间节点没有卫星数据,所以同样大小的磁盘页可以容纳更多的节点元素。这就意味着,数据量相同的情况下B+树的结构比B-树更加“矮胖”因此查询时IO次数也更少。其次,B+树的查询必须最终查找到叶子节点,而B-树只要找到匹配元素即可,无论匹配元素处于中间节点还是叶子节点。因此,B-树的查找性能并不稳定(最好情况是只查根节点,最坏情况是查到叶子节点)。而B+树的每一次查找都是稳定的。并且B+树的范围查询(例如查询3~11范围内的数据),只需要在链表上做遍历即可,比B-树方便了不少。

五.为什么说B+树比B树更适合数据库索引?

(1)B+树的磁盘读写代价更低

  B+树的内部结点并没有指向关键字具体信息的指针。因此其内部结点相对B 树更小。如果把所有同一内部结点的关键字存放在同一盘块中,那么盘块所能容纳的关键字数量也越多。一次性读入内存中的需要查找的关键字也就越多。相对来说IO读写次数也就降低了;

(2)B+树查询效率更加稳定

  由于非终结点并不是最终指向文件内容的结点,而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同,导致每一个数据的查询效率相当;

(3)B+树便于范围查询(最重要的原因,范围查找是数据库的常态)

  B树在提高了IO性能的同时并没有解决元素遍历的我效率低下的问题,正是为了解决这个问题,B+树应用而生。B+树只需要去遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的,而B树不支持这样的操作或者说效率太低;不懂可以看看这篇解读-》范围查找

补充:B树的范围查找用的是中序遍历,而B+树用的是在链表上遍历;

六.B+树的应用

mysql的InnoDB引擎使用的B+树。

猜你喜欢

转载自blog.csdn.net/ThinPikachu/article/details/113922320