mysql为什么用B+树

为什么不用哈希(又名散列)

  • 哈希表即散列表,原理就是用hash函数,将我们存的数据,以关键字的形式转换为hash值,然后根据hash值在内存中储存数据
  1. 无论读还是写,哈希都比树更快,那为什么索引结构要选用树型结构呢?因为对于分组、排序、比较,哈希型索引的时间复杂度会退化到O(n),且实际应用中,数据量数百万级别后,时间比较长。
  2. hash算法会存在hash冲突,尽管用了扰动函数,但数据量大了之后,还是会存在分布不均(扰动函数1扰动函数2

为什么不用二叉树

  1. 二叉树每个节点只分两个叉,每个节点只能存储一个记录,随着数据量的增大,树的高度会显著增高,而的高度越高,查询速度就越慢。
  2. 高度增加后,数就变成列表了,时间复杂度也就趋近与O(n)

为什么不用B-树

  1. B-树每层节点数目非常多,层数很少,相比二叉树减少了磁盘IO次数,但每个节点都存储数据,查询需要进行中序遍历,并不是快速定位数据的最佳方式。

AVL树

  1. 带有平衡条件:每个结点的左右子树的高度之差的绝对值(平衡因子)最多为1。也就是说,AVL树,本质上是带了平衡功能的二叉查找树。虽然数平衡了,查询比较快,但是,当插入数据的时候,为了达到平衡,得多次旋转。数据量大以后,旋转就特别耗时

红黑树

  1. 非平衡二叉树,但是数据大了,查询也会比较费时

B树

  1. 计算机数据IO时,查询数据没用连续读写。用的是4k或者N*4k读写。这样的好处是查询比较快
  2. 在这个4k的数据单元中。B树叶子节点存放了key和数据。这样,导致数据量越大,这个数据单元的数据就越多。若数据+key达到2k。那么每个节点就只能放2个数据了。

为什么用B+树,而不用B树

  1. B+树在B树基础上进行了改进,数据只存储在叶子节点上,且叶子节点之间增加了链表,这样获取节点时,不用中序遍历,这样便于快速定位数据,是减少磁盘IO的最佳方式。

 

猜你喜欢

转载自blog.csdn.net/zs319428/article/details/106859674