btreeプロパティ
B木としても知られるマルチチャンネルバランス探索木、フォークMのBツリーの特性を次のように
- ツリーの各ノードは、m個の子どもたちまでを含みます。
- ルートノードとリーフノードに加えて、各ノードは、少なくとも[CEIL(M / 2)]の子を有します。
- ルートがリーフノードでない場合には、少なくとも2人の子供があります。
- すべてのリーフノードは、同じレベルにあります。
- N及びN + 1つのポインタにより各非リーフノードのキーここで、[CEIL(M / 2)-1 <= N <= M-1。
btree挿入
B木フォーク5、例えば、キーの数:式導出[CEIL(M / 2)-1 <= N <= M-1。したがって、2 <= N <= 4。場合N> 4、親ノードに中間ノードを分割し、分割の両側のノード。
- CNGAHEKQMFWLTZDPRXYS例を挿入するには、最初の4つの文字は何も言うことはありません。
- インサートH、N> 4は、中間要素は、新しいノードに文字Gを分割します。
- Eを挿入し、K、Qを分割する必要はありません。
- Mが挿入され、中間要素Mの文字は、親ノードGに分割しました
- F、W、L、T分割する必要はありませんを挿入します。
- Zを挿入、T中間要素は、親ノードに分割しました。
- インサートDは、Dの中間要素は、親ノードに分割しました。そして、分割する必要はありませんP、R、X、Yを挿入します。
- 最後にS、NPQRノードN> 5を挿入し、Qは、中間ノードを分割するが、N> 5、DGMT分割の親ノードは、中間ノードMは、分割しました。元のB木第三子ノードがHKL DGノードが含まれていることに留意されたいです。
これ、のbtree建物が完成し、どのように?それは非常に簡単ではありません。長さではなく、物語を考えると、もう少し複雑な挿入よりも削除します。
B +ツリー
B +ツリーはB +ツリーは、B木と区別され、Bツリーバリアントであります:
- N-サブツリーNキーに最大B +ツリーを含む、そしてB木は、n-1番目の鍵まで含みます。
- B +ツリーのリーフノードは、すべての鍵情報、サイズに応じてキー配列を維持します。
- すべての非リーフノードが、インデックスキーの一部とみなすことができ、ノードは、その子ノードの唯一の最大(または最小)キーを含みます。
由于B+Tree只有叶子节点保存key信息,查询任何key都要从root走到叶子。所以B+Tree的查询效率更加稳定。
带有顺序指针的B+Tree
MySql索引数据结构对经典的B+Tree进行了优化。
在原B+Tree的基础上,增加一个指向相邻叶子节点的指针,就形成了带有顺序指针的B+Tree,提高区间访问的性能。
如上图访问18-49的元素,只需要顺着18的指针走向49即可。
MySql索引数据结构
在mysql中,索引的实现方式与存储引擎相关,MySql支持多种索引类型,如B+Tree、Hash索引、全文索引等等。在此只关注MyISAM与InnoDB的B+Tree索引数据结构。
MyISAM的B+Tree索引
MyISAM的主键索引与辅助索引在结构上没有任何区别,只是主键索引要求key唯一。可以看出,MyISAM的索引叶节点保存的是表的行的物理地址值。
MyISAM的索引是“非聚集”的,这么称呼只是为了与InnoDB的聚集索引相区分。
InnoDB的B+Tree索引
InnoDB的索引实现方式与MyISAM截然不同,InnoDB的B+Tree叶子节点保存有完整的记录信息。这也解释了上篇所说的InnoDB的索引与数据文件是同一个文件。
上图是B+tree的主键索引,这种索引也叫做聚集索引。InnoDB索引必须按照主键聚集,所有InnoDB必须要包含有主键。如果没有显示指定,MySql会自动选择一个唯一标识列或生成一个隐含字段作为主键。
上图是InnoDB的B+Tree辅助索引,B+Tree的叶子节点只保存主键的值而不是行的地址值。所以辅助索引的检索需要检索两遍索引。
因此,对于InnoDB的B+Tree索引使用有两个注意点:
- 建议使用主键自增。由于B+Tree的特性,非自增的主键在插入时会造成B+Tree频繁的分裂。
- 不建议主键字段过长。由于所有的辅助索引都会检索主键索引,过长的主键索引会使辅助索引过大。