B+树的研究

B+树是为磁盘或其他直接存取辅助设备而设计的一种平衡查找树，在B+树中，所有记录节点都是按键值的大小顺序存放在同一层的叶节点中，各叶节点指针进行连接。

首先，上一篇我们已经研究了B树的优点可以减少io，然后对比b树，B+树到底好在哪里呢？

由于B+树的数据都存储在叶子结点中，分支结点均为索引，方便扫库，只需要扫一遍叶子结点即可，但是B树因为其分支结点同样存储着数据，我们要找到具体的数据，需要进行一次中序遍历按序来扫，所以B+树更加适合在区间查询的情况，所以通常B+树用于数据库索引，而B树则常用于文件索引。
对比B树和B+树

区别有以下两点

1、 B+树中只有叶子节点会带有指向数据记录的指针（ROWID），而B树则所有节点都带有，在内部节点出现的索引项不会再出现在叶子节点中。

B+树中所有叶子节点都是通过指针连接在一起，而B树不会。
可以看到B+树后面是有顺序的

B+树的优点：

非叶子节点不会带上ROWID，这样，一个块中可以容纳更多的索引项，一是可以降低树的高度。二是一个内部节点可以定位更多的叶子节点。
叶子节点之间通过指针来连接，范围扫描将十分简单，而对于B树来说，则需要在叶子节点和内部节点不停的往返移动
B树的优点：
对于在内部节点的数据，可直接得到，不必根据叶子节点来定位。

接下来们来实现B+树的插入删除操作：
B+树的插入操作
我们建一个5阶的树
a)空树

b)依次插入8，10，15

c)插入16
插入16后超过了关键字的个数限制，所以要进行分裂。在叶子结点分裂时，分裂出来的左结点2个记录，右边3个记录，中间key成为索引结点中的key，分裂后当前结点指向了父结点（根结点）。
结果如下图所示

当然我们还有另一种分裂方式，给左结点3个记录，右结点2个记录，此时索引结点中的key就变为15。

d)插入17

e）插入18，插入后如下图所示

f）插入若干数据后

g）在上图中插入7，结果如下图所示
当前结点的关键字个数超过4，需要分裂。左结点2个记录，右结点3个记录。分裂后关键字7进入到父结点中，将当前结点的指针指向父结点，结果如下图所示。

当前结点的关键字个数超过4，需要继续分裂。左结点2个关键字，右结点2个关键字，关键字16进入到父结点中，将当前结点指向父结点，结果如下图所示。

参考文章：
https://www.sohu.com/a/156886901_479559
https://www.cnblogs.com/nullzx/p/8729425.html

B+树有一个特点：只有叶子节点带有卫星数据。其实就是索引地址。B+树查询的时候因为中间节点没有卫星数据，同样大小的磁盘页可以容纳更多的节点元素。意味着数据量相同的情况下，B+树会比B树更加的矮胖。
综合起来1、io次数更少2、查询性能稳定3、范围查询简便。

猜你喜欢