KD-Tree学习笔记

　　参考：https://trinkle23897.github.io/pdf/K-D%20Tree.pdf

　　KD-Tree是一种维护K维空间点的类似BST的数据结构。绝大多数时候只用来维护二维空间的点，因为维度越高复杂度越辣鸡。下面只考虑平面上的KD-Tree，即2D-Tree。

　　KD-Tree以分割平面来实现类似BST的建树。具体的，取该坐标中位数（即相当于划了一条直线）将点集划分成两部分，刚好被取作中位数的点放在该节点，并记录该节点管辖的平面区域范围。剩余的点分别放进左右儿子，递归建树。由于只需要按中位数分割，可以使用nth_element去掉排序的log。每次用来划分的维度应交替（或者随机，总之越均匀越好）选择，以保证之后查询的玄学复杂度。建树复杂度显然是O(nlogn)。

　　KD-Tree最常用的是用来查找某点的曼哈顿/欧几里得距离最近点。具体做法实际上就是A*，即考虑应该往一个节点的左儿子还是右儿子继续查找时，通过节点的平面区域范围给它一个估价函数（当然不劣于实际），如果估价劣于已经找到的最优答案，当然不继续递归，否则优先递归估价较优的。据说复杂度随机O(logn)，能卡到O(√n)。

　　同时KD-Tree还可以滋磁矩形查询。具体做法实际上就是线段树，即如果当前节点所管辖的范围被查询范围包含，直接返回该节点答案，否则暴力递归左右节点查询。丝毫不会证复杂度。

　　插入一个点是非常正常的操作，但是在KD-Tree里插入点有和BST一样的问题，即一不小心就不平衡了。如果可以离线，事实上可以先给所有点建好KD-Tree，将一开始不存在的点打上标记，实际插入该点时清除标记激活该点。如果强制在线，则使用替罪羊式的重构。

猜你喜欢