学习B+树

B+树是一个n叉树，每个结点通常有多个孩子，一棵B+树包含根结点、内部结点和叶子结点。根结点可能没有子女，也可能有两个或两个以上子女（就是说不可能只有一个子女）。

m阶B+树和m阶B-树的差异在于：
1.有n棵子树的结点中含有n个关键字；
2.所有的叶子结点中包含了全部关键码的信息，及指向含有这些关键码记录的指针，且叶子结点本身依关键码的大小自小而大的顺序链接。
3.所有的非终端结点可以看成是索引部分，结点中仅
含有其子树根结点中最大（或最小）关键码。

通常在B+树上有两个头指针，一个指向根结点，另一个指向关键字最小的叶子节点。因此可以对B+树进行两种查找运算：一种是从最小关键字起顺序查找，另一种是从根节点开始，进行随机查找。在B+树上进行随机查找、插入和删除的过程基本上与B-树类似。只是在查找时，若非终端结点上的关键码等于给定值，并不终止，而是继续向下直到叶子结点。因此，在B+树，不管查找成功与否，每次查找都是走了一条从根到叶子结点的路径。

B+树在数据库中的应用
目前大部分数据库系统及文件系统都采用B-Tree或其变种B+Tree作为索引结构。在数据库索引的应用中，B+树按照下列方式进行组织：
① 叶结点的组织方式。B+树的查找键是数据文件的主键，且索引是稠密的。也就是说，叶结点中为数据文件的第一个记录设有一个键、指针对，该数据文件可以按主键排序，也可以不按主键排序（即数据文件的排序可以跟索引的排序无关）；数据文件按主键排序，则B +树上的关键码为稀疏索引，即在叶结点中为数据文件的每一个“块”设有一个键、指针对；数据文件不按键属性排序，且该属性是 B +树的查找键，叶结点中为数据文件里出现的每个“属性”K设有一个键、指针对，其中指针执行排序键值为 K的记录中的第一个。
② 非叶结点的组织方式。B+树中的非叶结点形成了叶结点上的一个多级稀疏索引。每个非叶结点中至少有ceil( m/2 ) 个指针，至多有 m 个指针。

PS:
稠密索引：如果记录是排好序的，我们就可以在记录上建立稠密索引，它是这样一系列存储块：块中只存放记录的键以及指向记录本身的指针，指针就是一个指向记录或存储块地址。稠密索引文件中的索引块保持键的顺序与文件中的排序顺序一致。既然我们假定查找键和指针所占存储空间远小于记录本身，我们就可以认为存储索引文件比存储数据文件所需存储块要少得多。当内存容纳不下数据文件，但能容纳下索引文件时，索引的优势尤为明显。这时，通过使用索引文件，我们每次查询只用一次I/O操作就能找到给定键值的记录。

稀疏索引：稀疏索引只为数据文件的每个存储块设一个键-指针对，它比稠密索引节省了更多的存储空间，但查找给定值的记录需更多的时间。只有当数据文件是按照某个查找键排序时，在该查找键上建立的稀疏索引才能被使用，而稠密索引则可以应用在任何的查找键。

猜你喜欢