『数据结构』线段树

线段树原理

线段树，类似区间树，它在各个节点保存一条线段（数组中的一段子数组），主要用于高效解决连续区间的动态查询问题，由于二叉结构的特性，它基本能保持每个操作的复杂度为\(O(logn)\)。

线段树的每个节点表示一个区间，子节点则分别表示父节点的左右半区间，例如父亲的区间是\([a,b]\)，那么\((c=(a+b)/2)\)左儿子的区间是\([a,c]\)，右儿子的区间是\([c+1,b]\)。

下面我们从一个经典的例子来了解线段树，问题描述如下:从数组a[0...n-1]中查找某个数组某个区间内的最小值，其中数组大小固定，但是数组中的元素的值可以随时更新。

对这个问题一个简单的解法是：遍历数组区间找到最小值，时间复杂度是\(O(n)\),额外的空间复杂度\(O(1)\)。当数据量特别大，而查询操作很频繁的时候，耗时可能会不满足需求。

另一种解法：使用一个二维数组来保存提前计算好的区间\([i,j]\)内的最小值，那么预处理时间为\(O(n^2)\)，查询耗时\(O(1)\), 但是需要额外的\(O(n^2)\)空间，当数据量很大时，这个空间消耗是庞大的，而且当改变了数组中的某一个值时，更新二维数组中的最小值也很麻烦。

我们可以用线段树来解决这个问题：预处理耗时\(O(n)\)，查询、更新操作\(O(logn)\)，需要额外的空间\(O(n)\)。根据这个问题我们构造如下的二叉树

叶子节点是原始组数\(a\)中的元素
非叶子节点代表它的所有子孙叶子节点所在区间的最小值
例如对于数组\([2, 5, 1, 4, 9, 3]\)可以构造如下的二叉树（背景为白色表示叶子节点，非叶子节点的值是其对应数组区间内的最小值，例如根节点表示数组区间\(a[0...5]\)内的最小值是1）：

由于线段树的父节点区间是平均分割到左右子树，因此线段树是完全二叉树，对于包含\(n\)个叶子节点的完全二叉树，它一定有\(n-1\)个非叶节点，总共\(2n-1\)个节点，因此存储线段是需要的空间复杂度是\(O(n)\)。那么线段树的操作：创建线段树、查询、节点更新是如何运作的呢（以下所有代码都是针对求区间最小值问题）？

对于线段树我们可以选择和普通二叉树一样的链式结构。由于线段树是完全二叉树，我们也可以用数组来存储，下面的讨论及代码都是数组来存储线段树，节点结构如下（注意到用数组存储时，有效空间为\(2n-1\),实际空间确不止这么多，比如上面的线段树中叶子节点\(1\)、\(3\)虽然没有左右子树，但是的确占用了数组空间，实际空间是满二叉树的节点数目。

线段树的代码实现

建线段树的过程

void build(int l, int r, int root)
{
    if (l==r)
    {
        sum[root]=a[l];
        return;
    }
    int mid=(l+r)>>1;
    build(l,mid,root<<1);
    build(mid+1,r,root<<1|1);
    pushup(root);
}

pushup过程

void push(int root)
{
    sum[root]=sum[root<<1]+sum[root<<1|1];
}

查询线段树

int query(int ansl, int ansr, int l, int r,int root)
{
    if (ansl<=l && r<=ansr) return sum[root];
    int mid=(l+r)>>1;
    int ans=0;
    if (ansl<=mid) ans+=query(ansl,ansr,l,mid,root<<1);
    if (ansr>mid) ans+=query(ansl,ansr,mid+1,r,root<<1|1);
    return ans;
}

单节点更新

void update(int pos, int c, int l, int r, int root)
{
    if (l==r)
    {
        sum[root]+=c;
        return;
    }
    int mid=(l+r)/2;
    if (pos<=mid) update(pos,c,l,mid,root<<1); else update(pos,c,mid+1,r,root<<1|1);
    pushup(root);
}