什么是B+树。B+树的插入。B+树的删除。B+树和B-树的区别。

一.B+树的概述

二.B+树的插入操作

三.B+树的删除操作

四.B+树的特点

五.为什么说B+树比B树更适合数据库索引？

六.B+树的应用

一.B+树的概述

B+树是B树的一种变形形式，B+树上的叶子结点存储关键字以及相应记录的地址，叶子结点以上各层作为索引使用。一棵m阶的B+树的特征与B树大同小异，但是有以下几点需注意：

有m个子树的中间节点必有m个元素（B树中是m-1个元素），但每个元素不保存数据，只用来索引；
所有的叶子结点中包含了全部关键字的信息，及指向含有这些关键字记录的指针，且叶子结点本身依关键字的大小自小而大的顺序链接。 (而B 树的叶子节点并没有包括全部需要查找的信息)；
所有的非终端结点可以看成是索引部分，结点中仅含有其子树根结点中最大（或最小）关键字。 (而B 树的非终节点也包含需要查找的有效信息)；
B+树的查找与B树不同，当索引部分某个结点的关键字与所查的关键字相等时，并不停止查找，应继续沿着这个关键字左边的指针向下，一直查到该关键字所在的叶子结点为止。

B+树的特征：

有k个子树的中间节点包含有k个元素（B树中是k-1个元素），每个元素不保存数据，只用来索引，所有数据都保存在叶子节点。
所有的叶子结点中包含了全部元素的信息，及指向含这些元素记录的指针，且叶子结点本身依关键字的大小自小而大顺序链接。
所有的中间节点元素都同时存在于子节点，在子节点元素中是最大（或最小）元素。

例如下图所示的一个4阶B+树

二.B+树的插入操作

现有一个如下图所示的B+树

现在我们要将54插入

我们接着再插入9和13

插入40

插入43后

插入44

三.B+树的删除操作

删除1

删除44

删除50

删除40

更多的插入或者删除的情况大家可以自行在这个网站中去学习：

https://www.cs.usfca.edu/~galles/visualization/BPlusTree.html

四.B+树的特点

这个特点是在索引之外，确是至关重要的特点。那就是[卫星数据]的位置。所谓卫星数据，指的是索引元素所指向的数据记录，比如数据库中的某一行。在B-树中，无论中间节点还是叶子节点都带有卫星数据。而在B+树当中，只有叶子节点带有卫星数据，其余中间节点仅仅是索引，没有任何数据关联。

B-树中的卫星数据（Satellite Information）：

B+树中的卫星数据（Satellite Information）：

B+树设计成这样的好处首先，B+树的中间节点没有卫星数据，所以同样大小的磁盘页可以容纳更多的节点元素。这就意味着，数据量相同的情况下B+树的结构比B-树更加“矮胖”因此查询时IO次数也更少。其次，B+树的查询必须最终查找到叶子节点，而B-树只要找到匹配元素即可，无论匹配元素处于中间节点还是叶子节点。因此，B-树的查找性能并不稳定（最好情况是只查根节点，最坏情况是查到叶子节点）。而B+树的每一次查找都是稳定的。并且B+树的范围查询（例如查询3~11范围内的数据），只需要在链表上做遍历即可，比B-树方便了不少。

五.为什么说B+树比B树更适合数据库索引？

（1）B+树的磁盘读写代价更低

　　B+树的内部结点并没有指向关键字具体信息的指针。因此其内部结点相对B 树更小。如果把所有同一内部结点的关键字存放在同一盘块中，那么盘块所能容纳的关键字数量也越多。一次性读入内存中的需要查找的关键字也就越多。相对来说IO读写次数也就降低了；

（2）B+树查询效率更加稳定

　　由于非终结点并不是最终指向文件内容的结点，而只是叶子结点中关键字的索引。所以任何关键字的查找必须走一条从根结点到叶子结点的路。所有关键字查询的路径长度相同，导致每一个数据的查询效率相当；

（3）B+树便于范围查询（最重要的原因，范围查找是数据库的常态）

　　B树在提高了IO性能的同时并没有解决元素遍历的我效率低下的问题，正是为了解决这个问题，B+树应用而生。B+树只需要去遍历叶子节点就可以实现整棵树的遍历。而且在数据库中基于范围的查询是非常频繁的，而B树不支持这样的操作或者说效率太低；不懂可以看看这篇解读-》范围查找

补充：B树的范围查找用的是中序遍历，而B+树用的是在链表上遍历；

六.B+树的应用

mysql的InnoDB引擎使用的B+树。