数据库索引数据结构btree,b-tree和b+tree树

1.B-Tree树的介绍:
  1)是一种适用于外查找的树,它是一种平衡的多叉树,称为B树
  2)一颗M阶B-Tree具有的特性:

    1)如果根结点不是叶子结点的话,那么它的子结点数至少为2
    2)除结点与叶子结点外,其他结点的孩子数为[ceil(m/2),m]个,ceil函数表示向上取整数
    3)所有叶子结点都在同一层(因为它是分裂向上生成父结点的)
    4)各个结点的关键字都是从小到大排序的,
    5)且每个结点的关键字数量满足[floor(m/2),m-1],floor为向下取整函数
    6)父结点的关键字的左孩子都小于它,右孩子都大于它.
  3)B-Tree树的插入操作
    1)插入新元素,如果叶子结点的空间足够,则插入其中,根据与根节点的判断其插入的位置
    2)如果结点空间满了的话,进行分裂,将结点中的中间关键字上移作为父节点,将结点中的其他的一半关键字分别作为此结点的左右结点
  4)B-Tree树的删除操作
    1)先查找B-tree树需要删除的元素,如果该元素在B-tree中存在,则将该元素在结点中删除
    2)删除元素后,判断元素有无左右孩子结点,如果有,则上移与删除元素相近的孩子结点元素到父结点中;
    3)然后判断所有结点中元素个数个数是否有小于ceil(m/2)-1的,找到其相邻兄弟元素个数是否大于ceil(m/2)-1
如果足够:
1)向父节点借一个元素,同时将借的元素的孩子结点中相邻后继元素上移到父结点中;
如果不够:
2)其相邻兄弟借完后结点元素个数少于floor(m/2),那将父结点的元素下移到要合并的左右子结点中,然后进行合并(且父元素的值应该是处于左右孩子之间的)
3)由于索引文件,无论是插入还是删除B-Tree结点,不断地分裂和合并结点来维持B-Tree结构是非常昂贵的操作,所有数据库的索引都采用的B+tree

2.B+Tree树的介绍:
  1)MySQL索引采用B+Tree,它是应文件系统所需而产生的一种B-tree的变形树
  2)与B-Tree树的差异:
    1)非叶子结点的子树指针与关键字个数相同
    2)B+树父结点中记录,存储的是下层子树中的最小值
    3)所有叶子结点通过一个链指针相连
    4)所有关键字都在叶子结点出现;
  3)B+Tree的分裂:
    1)当一个结点满时,分配一个新的结点,并将原结点中1/2的数据复制到新结点,最后在父结点中增加新结点的指针;
    2)B+树的分裂只影响原结点和父结点,而不会影响兄弟结点,所以它不需要指向兄弟的指针;

3.B*Tree的介绍:
  1)B*Tree是B+树的变体,在B+Tree的非根和非叶子结点再增加指向兄弟的指针
  2)B*Tree的区别:
    1)B*树定义了非叶子结点关键字个数至少为(2/3)*M,即块的最低使用率为2/3(代替B+树的1/2);
    2)B*树的分裂:
      1)当一个结点满时,如果它的下一个兄弟结点未满,那么将一部分数据移到兄弟结点中,
      2)再在原结点插入关键字,最后修改父结点中兄弟结点的关键字(因为兄弟结点的关键字范围改变了)
      3);如果兄弟也满了,则在原结点与兄弟结点之间增加新结点,并各复制1/3的数据到新结点,最后在父结点增加新结点的指针;


4.总结:
B-树:多路搜索树,每个结点存储floor(M/2)到M-1个关键字,非叶子结点存储指向关键字范围的子结点;
所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中
B+树:在B-树的基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现
,非叶子结点作为叶子结点的索引;B+树总是到叶子结点才命中
B*树:在B+树的基础上,为非叶子结点也增加链表指针,将结点的最低利用率从1/2提高到2/3
补充:B*树分配新结点的概率比B+树要低,空间使用率更高

猜你喜欢

转载自www.cnblogs.com/nyhhd/p/12546277.html