本系列文章将于2021年整理出版。前驱教材：《算法竞赛入门到进阶》清华大学出版社
网购：京东当当作者签名书：点我
有建议请加QQ 群：567554289

文章目录

1. 线段树概念
2. 区间查询
3. 区间操作与lazy-tag
4. 基础例题
5. 区间最值和区间历史最值
6. 区间合并
7. 扫描线
8. 二维线段树
【线段树习题】

线段树和树状数组都是解决用于区间问题的数据结构。线段树有两个基本应用场景：区间最值、区间和。
（1）区间最值问题。
有长度为n的数列，需要以下操作：
1）求最值：给定i, j ≤ n，求区间[i, j]内的最值。
2）修改元素：给定k和x，把第k个元素a[k]改成x。
如果用普通数组存储数列，上面2个操作，求最值的复杂度是O(n)，修改是O(1)。如果有m次“修改元素+查询最值”，那么总复杂度是O(mn)。如果m和n比较大，例如 $10^5$ ，那么整个程序的复杂度是 $10^10$ 数量级，这个复杂度在算法竞赛中是不可接受的。
（2）区间和问题。给出一个数列，先更改某些数的值，然后给定i, j ≤ n，求[i, j]的区间和。如果用数组存数据，一次求和是O(n)的；如果更改和询问的操作总次数是m，那么整个程序的复杂度是O(mn)。这样的复杂度也是不行的。
对于这两类问题，线段树都能在O(mlogn)的时间内解决。在上面两个基本应用场景的基础上，线段树还发展出了各种丰富的应用。
树状数组和线段树各有优点。
（1）逻辑结构。线段树基于二叉树，数据结构非常直观，更清晰易懂；另外，由于二叉树灵活而丰富，能用于更多场合，比树状数组适应面多。
（2代码长度。线段树的编码需要维护二叉树，而树状数组只需简单地处理一个Tree数组，所以线段树的代码更长。不过，二叉树也可以用数组（满二叉树）来写，代码能稍微减少一点。

1. 线段树概念

概况地说，线段树是“分治法思想 + 二叉树结构 + lazy-tag技术”。

1.1 线段树是分治法和二叉树的结合
线段树是一棵二叉树，树上的结点是“线段”（或者理解为“区间”）。下图是包含10个元素的线段树，观察这棵树，它的基本特征是：
（1）用分治法自顶向下建立，每次分治左右子树各一半；
（2）每个结点都表示一个“线段”，非叶子结点包含多个元素，叶子结点只有一个元素；
（3）除了最后一层，其他层都是满的，这种结构的二叉树，层数是最少的。

图1 线段[1, 10]的线段树结构

考查每个线段[L, R]，L是左端，R是右端。
（1）L = R，说明这个结点只有一个元素，它是一个叶子结点。
（2）L < R，说明这个结点代表的不只一个点，那么它有两个儿子，左儿子区间是[L, M]，右儿子区间是[M+1, R]，其中M = (L + R) / 2。例如：L = 1，R = 5，M = 3，左儿子是[1, 3]，右儿子是[4, 5]。
线段树是二叉树，一个区间每次折一半往下分，包含n个元素的线段树，最多分logn次就到达最低层。需要查找一个点或者区间的时候，顺着结点往下找，最多logn次就能找到。
结点所表示的“线段”的值，可以是区间和、最值或者其他根据题目灵活定义的值。

1.2 二叉树的实现
编码时，可以定义标准的二叉树数据结构；在竞赛中一般用静态数组实现的满二叉树，虽然比较浪费空间，但是编码稍微简单一点。
下面给的代码，都用静态分配的tree[]。父结点和子结点之间的访问非常简单，缺点是最后一行有大量结点被浪费。

//定义根结点是tree[1]，即编号为1的结点是根
//（1）第一种方法：定义二叉树数据结构
struct{
    int L, R, data;             //用tree[i].data记录线段i的最值或区间和
}tree[MAXN*4];                  //分配静态数组，开4倍大
//（2）第二种方法：直接用数组表示二叉树，更节省空间
int tree[MAXN*4];	             //用tree[i]记录线段i的最值或区间和
//以上两种方式，都满足下面的父子关系。结点p是父，结点ls(p)是左儿子，rs(p)是右儿子
int ls(int x){ return x<<1;  }     //左儿子，编号是 p*2
int rs(int x){ return x<<1|1;}     //右儿子，编号是 p*2+1

注意，二叉树的空间需要开MAXN*4，即元素数量的4倍，下面说明原因。假设有一棵处理n个元素（叶子结点有n个）的线段树，且它的最后一层只有1个叶子，其他层都是满的；如果用满二叉树表示，它的结点总数是：最后一层有2n个结点（其中2n - 1个都浪费了没用到），前面所有的层有2n个结点，共4n个结点。空间的浪费是二叉树的本质决定的：它的每一层都按2倍递增。
建树的代码：

void push_up(int p){                           //从下往上传递区间值
    tree[p] = tree[ls(p)] + tree[rs(p)];      //区间和
    //tree[p] = min(tree[ls(p)], tree[rs(p)]);//求最小值
}
void build(int p,int pl,int pr){           //结点编号p指向区间[pl, R]
    if(pl==pr){tree[p]=a[pl]; return; }    //最底层的叶子，存叶子的值
    int mid = (pl+pr) >> 1;                //分治：折半
    build(ls(p),pl,mid);                   //递归左儿子
    build(rs(p),mid+1,pr);                 //递归右儿子
    push_up(p);                            //从下往上传递区间值
}

1.3 单点修改和区间修改
如果只需修改一个元素（单点修改），直接修改叶子结点上元素的值，然后从下往上更新线段树，操作次数也是O(logn)。如果修改的是一个区间的元素（区间修改），需要用到lazy-tag技术。
单点修改包含于区间修改，后面几节给出区间修改的代码。

2. 区间查询

2.1 查询最值
以数列{1, 4, 5, 8, 6, 2, 3, 9, 10, 7}为例。首先建立一棵用满二叉树实现的线段树，用于查询任意子区间的最小值。如下图所示，每个结点上圆圈内的数字是这棵子树的最小值。圆圈旁边的数字，例如根结点的"1:[1,10]"，1表示结点的编号，[1,10]是这个结点代表的元素范围，即第1到第10个元素。

图2 查最小值的线段树

查询任意区间[i, j]的最小值。例如查区间[4, 9]的最小值，递归查询到区间[4, 5]、[6, 8]、[9, 9]，见图中画横线的线段，得最小值min{6, 2, 10} = 2。查询在O(logn)时间内完成。读者可以注意到，在这种情况下，线段树很像一个最小堆。
m次“单点修改+区间查询”的总复杂度是O(mlogn)。对规模100万的问题，也能轻松解决。

2.2 查询区间和
首先建立一棵用于查询{1, 4, 5, 8, 6, 2, 3, 9, 10, 7}区间和的线段树，每个结点上圆圈内的数字是这棵子树的和。

图3 区间和的线段树

例如查区间[4, 9]的和，递归查询到区间[4, 5]、[6, 8]、[9, 9]，见图中画横线的线段，得sum{14, 14, 10} = 38。查询在O(logn)的时间内完成。

2.3 区间查询代码
下面以查询区间[L, R]的和为例，给出代码。查询递归到某个结点p（p表示的区间是[pl, pr]）时，有3种情况：
（1）[L, R]完全覆盖了[pl, pr]，即L ≤ pl ≤ pr ≤ R，直接返回p的值即可。
（2）[L, R]与[pl, pr]不相交，即 L > pr或者R < pl，退出。
（3）[L, R]与[pl, pr]部分重叠，分别搜左右子结点。L < pr，继续递归左子结点，例如查询区间[4, 9]，与第2个结点[1, 5]有重叠，因为4 < 5。R > pl，继续递归右子结点，例如[4, 9]与第3个结点[6, 10]有重叠，因为9 > 6。

int query(int L,int R,int p,int pl,int pr){             
    if(L<=pl && pr<=R) return tree[p];       //完全覆盖
    int mid = (pl+pr)>>1;
    if(L<=mid) res+=query(L,R,ls(p),pl,mid);   //L与左子节点有重叠  
    if(R>mid)  res+=query(L,R,rs(p),mid+1,pr); //R与右子节点有重叠
    return res;
}
//调用方式：query(L, R, 1, 1, n)

3. 区间操作与lazy-tag

本节介绍线段树的核心技术“lazy-tag”，并给出“区间修改+区间查询”的模板。
在“树状数组”这一节，曾经以洛谷 3372题为例，用树状数组求解了“区间修改 + 区间查询”。本节用线段树求解，这是最标准的解法。
在树状数组这一节中，已经指出区间修改比单点修改复杂很多。最普通区间修改，例如对一个数列的[L, R]区间内每个元素统一加上d，如果在线段树上，一个个地修改这些元素，那么m次区间修改的复杂度是O(mnlogn)的。
解决的办法很容易想到，还是利用线段树的特征：线段树的结点tree[i]，记录了i这个区间的值。那么可以再定义一个tag[i]，用它统一记录i这个区间的修改，而不是一个个地修改区间内的每个元素，这个办法被称为“lazy-tag”。
lazy-tag（懒惰标记，或者延迟标记）。当修改的是一个线段区间时，就只对这个线段区间进行整体上的修改，其内部每个元素的内容先不做修改，只有当这个线段区间的一致性被破坏时，才把变化值传递给下一层的子区间。每次区间修改的复杂度是O(logn)的，一共m次操作，总复杂度是O(mlogn)的。区间i的lazy操作，用tag[i]记录。
下面举例说明区间修改函数update()的具体步骤。例如把[4, 9]区间内的每个元素加3，执行步骤是：
（1）左子树递归到结点5，即区间[4, 5]，完全包含在[4, 9]内，打标记tag[5] = 3，更新tree[5]为20，不再继续深入；
（2）左子树递归返回，更新tree[2]为30；
（3）右子树递归到结点6，即区间[6, 8]，完全包含在[4, 9]内，打标记tag[6]=3，更新tree[6]为23。
（4）右子树递归到结点14，即区间[9, 9]，打标记tag[14]=3，更新tree[14]=13；
（5）右子树递归返回，更新tree[7]=20；继续返回，更新tree[3]=43；
（6）返回到根节点，更新tree[1]=73。
详情见下图。

图4 区间加

push_down()函数。在进行多次区间修改时，一个结点需要记录多个区间修改。而这些区间修改往往有冲突，例如做2次区间修改，一次是[4, 9]，一次是[5, 8]，它们都会影响5:[4, 5]这个结点。第一次修改[4, 9]覆盖了结点5，用tag[5]做了记录；而第二次修改[5, 8]不能覆盖结点5，需要再向下搜到结点11:[5, 5]，从而破坏了tag[5]，此时原tag[5]记录的区间统一修改就不得不往它的子结点传递和执行了，传递后tag[5]失去了意义，需要清空。所以lazy-tag的主要操作是解决多次区间修改，用push_down()函数完成。它首先检查结点p的tag[p]，如果有值，说明前面做区间修改时给p打了tag标记，接下来就把tag[p]传给左右子树，然后把tag[p]清零。
push_down()函数不仅在“区间修改”中用到，在“区间查询”中同样用到。
下面给出洛谷P3372的线段树代码，它是“区间修改+区间查询”的模板题。
注意代码中对二叉树的操作，特别是反复用到的变量pl和pr，它们是结点p所指向的原数列的区间位置[pl, pr]。p是二叉树的某个结点，范围是1 ≤ p ≤ MAXN*4；而pl、pr的范围是1 ≤ pl, pr ≤ n，n是数列元素的个数。用满二叉树实现线段树时，一个结点p所指向的[pl, pr]是确定的，也就是说，给定p，可以推算出它的[pl, pr]。

//洛谷 P3372，线段树，区间修改 + 区间查询
#include<bits/stdc++.h>
using namespace std;
#define ll long long
const int MAXN = 1e5 + 10;
ll a[MAXN];      //记录数列的元素，从a[1]开始
ll tree[MAXN<<2];//tree[i]：第i个结点的值，表示一个线段区间的值，例如最值、区间和
ll tag[MAXN<<2]; //tag[i]：第i个结点的lazy-tag，统一记录这个区间的修改
ll ls(ll x){ return x<<1;  }     //定位左儿子：x*2
ll rs(ll x){ return x<<1|1;}     //定位右儿子：x*2 + 1
void push_up(ll p){              //从下往上传递区间值
    tree[p] = tree[ls(p)] + tree[rs(p)]; 
     //本题是区间和。如果求最小值，改为：tree[p] = min(tree[ls(p)], tree[rs(p)]);
}
void build(ll p,ll pl,ll pr){    //建树。p是结点编号，它指向区间[pl, pr]
    tag[p] = 0;                  //lazy-tag标记
    if(pl==pr){tree[p]=a[pl]; return;}  //最底层的叶子，赋值    
    ll mid = (pl+pr) >> 1;       //分治：折半
    build(ls(p),pl,mid);         //左儿子
    build(rs(p),mid+1,pr);       //右儿子
    push_up(p);                  //从下往上传递区间值
} 
void addtag(ll p,ll pl,ll pr,ll d){   //给结点p打tag标记，并更新tree
    tag[p] += d;                   //打上tag标记
    tree[p] += d*(pr-pl+1);        //计算新的tree
}
void push_down(ll p,ll pl,ll pr){     //不能覆盖时，把tag传给子树
    if(tag[p]){                       //有tag标记，这是以前做区间修改时留下的
        ll mid = (pl+pr)>>1; 
        addtag(ls(p),pl,mid,tag[p]);    //把tag标记传给左子树
        addtag(rs(p),mid+1,pr,tag[p]);  //把tag标记传给右子树
        tag[p]=0;                       //p自己的tag被传走了，归0
    }
}
void update(ll L,ll R,ll p,ll pl,ll pr,ll d){ //区间修改：把[L, R]内每个元素加上d
    if(L<=pl && pr<=R){  //完全覆盖，直接返回这个结点，它的子树不用再深入了    
        addtag(p, pl, pr,d);  //给结点p打tag标记，下一次区间修改到p这个结点时会用到
        return;                    
    }
    push_down(p,pl,pr);             //如果不能覆盖，把tag传给子树
    ll mid=(pl+pr)>>1;
    if(L<=mid) update(L,R,ls(p),pl,mid,d);    //递归左子树
    if(R>mid)  update(L,R,rs(p),mid+1,pr,d);  //递归右子树
    push_up(p);                               //更新
}
ll query(ll L,ll R,ll p,ll pl,ll pr){
           //查询区间[L,R]；p是当前结点（线段）的编号，[pl,pr]是结点p表示的线段区间
    if(pl>=L && R >= pr) return tree[p];       //完全覆盖，直接返回
    push_down(p,pl,pr);                        //不能覆盖，递归子树
    ll res=0;
    ll mid = (pl+pr)>>1;
    if(L<=mid) res+=query(L,R,ls(p),pl,mid);   //左子节点有重叠
    if(R>mid)  res+=query(L,R,rs(p),mid+1,pr); //右子节点有重叠
    return res;
}
int main(){
    ll n, m; scanf("%lld%lld",&n,&m);
    for(ll i=1;i<=n;i++)  scanf("%lld",&a[i]);
    build(1,1,n);                   //建树
    while(m--){
        ll q,L,R,d;
        scanf("%lld",&q);
        if (q==1){                   //区间修改：把[L,R]的每个元素加上d
           scanf("%lld%lld%lld",&L,&R,&d);
           update(L,R,1,1,n,d); 
        }
        else {                        //区间询问：[L,R]的区间和
           scanf("%lld%lld",&L,&R);
           printf("%lld\n",query(L,R,1,1,n));   
        }       
    }
    return 0;
}

下面把树状数组和线段树做个对比。
（1）时间复杂度。都是O(nlogn)，若时间限制为1秒，能解决MAXN = $10^6$ 的问题。
（2）空间复杂度。树状数组定义了long long tree1[MAXN], tree2[MAXN]，空间为16M；线段树定义了long long a[MAXN], tree[MAXN*4]，tag[MAXN*4]，空间为72M。
具体的题目，可以根据情况选用树状数组和线段树。很多题目只能用线段树，如果两种都能用，建议先考虑用线段树。线段树的代码长很多，但是更容易理解、编码更清晰，做题时间更短。而树状数组的局限性很大，即使能用，也常常需要经过较难的思维转换，区间修改就是一个例子。
下一节给出几个基础例题，请在看题解之前，先自己思考和编码，否则会失去建模的乐趣。另外请读者思考是否能用树状数组解题。

4. 基础例题

本节的例题是基本的“区间修改+区间查询”代码的应用。

4.1 特殊的区间修改

Can you answer these queries? hdu 4027
题目描述：把区间内的每个数开平方；输出区间查询。
输入：有很多测试用例。每个用例的第一行是一个整数N，表示有N个数，1<=N<=100000。第二行包括N个整数Ei，Ei < $2^{63}$ 。第三行是整数M，表示M个操作，1<=M<=100000。后面有M行，每行有三个整数T、X、Y，T=0表示修改，把[X,Y]区间的每个数开平方（开方结果向下取整）。T=1是查询，求[X, Y]的区间和。
输出：对每个用例，打印用例编号，然后对每个操作打印一行。

题解：标准的线段树区间修改是区间加或者区间最值，本题的修改是把区间每个数开方。
如果按正规的区间修改，用lazy-tag标记区间，很难编码。注意本题的关键是开方计算，而一个数最多经过7次开方就变成了1，1继续开方仍保持1不变。利用这个特点，再结合线段树编码。
编码：（1）一个区间内如果有数的开方结果不是1，则单独计算它；（2）一个区间的所有数减为1后，标记lazy-tag = 1，后面不再对这个区间做开方操作。具体编码的时候，不一定用到lazy-tag，直接判断区间和即可，如果区间和等于子树的叶子数，说明叶子的值都是1。
复杂度：对N个数每个数开方7次，共7N次；再做M次修改和区间查询，复杂度O(MlogN)。总复杂度符合要求。

4.2 同时做多种区间修改和区间查询
标准的线段树模板只有一种区间修改，一种区间查询，而竞赛题中一般出现的是同时有多种操作。下面的例题同时有三种区间修改，三种区间查询。

Transformation hdu 4578
题目描述：有n个整数，执行多种区间操作：
add修改：区间内每个数加上c；
multi修改：区间内每个数乘以c；
change修改：区间内每个数统一改成c；
sum求和：对区间内每个数的p次方求和，输出结果。1 <= p <= 3，即求和、平方和、立方和。

题解：此题有多种操作，每个操作如果单独编码，并不太难。但是题目要求同时做三种修改，并有三种求和询问，非常麻烦。
三种修改add、multi、change，在结点上分别用三个lazy-tag标记。三个标记的关系是：
（1）做change时，原有的add和multi标记失效；
（2）做multi时，如果原有add标记，把add改为add*multi；
（3）pushdown时，先执行add，再multi，最后add。
三种询问：求和sum1、平方和sum2、立方和sum3。对于change和multi标记，三种询问都容易计算。对于add标记，求和很容易，而平方和、立方和需要推理。
（1）平方和。 $(a + c)^2 = a^2 + c^2 + 2ac$ ，即sum2[new] = sum2[old] + (R - L + 1)×c×c + 2×sum1×c，其中[L, R]是区间，sum2[new]和sum2[old]分别表示sum2的新值和旧值。
（2）立方和。 $(a + c)^3 = a^3 + c^3 + 3c(a^2 + ac)$ ，即sum3[new] = sum3[old] + c×c×c + 3×c×(sum2[old] + sum[old]×c)。

4.3 线段树的二分操作
线段树的结构是二分，在线段树上做二分查找很方便。

Vases and Flowers hdu 4614
题目描述：Alice有N个花瓶，编号0 ~ N-1，一个花瓶中只能插一朵花。Alice经常收到很多花并插到花瓶中，她也经常清理花瓶。
输入：第一行是整数T，表示测试样例数。对每个测试，第一行有两个整数N，M，1<N, M<50001，N是花瓶数量，M是Alice的操作次数。后面的M行，每行有3个整数，有两种操作：
1 A F 收到F朵花，从第A个花瓶开始插，如果花瓶中原来有花，就跳过去插下一个花瓶，如果插到最后的花瓶花还没插完就丢弃。
2 A B 清理从A到B的花瓶。
输出：对第1种操作，输出插入花瓶的第一个和最后一个位置，如果无法插入，输出“Can not put any one.”；对第2种操作，输出丢弃的花的数量。

题解：用线段树。把区间和定义为这个区间内插了花的花瓶的个数。
第2种操作是标准的“区间求和+区间修改”，先查询[A, B]的区间和，输出丢弃的花的数量，然后区间更新，即把区间内所有数置零。
第1种操作，关键是找到第一个和最后一个空花瓶。线段树本身是二分的结构，用二分法找。
（1）找第一个空花瓶。在[A, N-1]区间内二分，找到第一个等于0的位置pos1。
（2）找最后一个空花瓶。在[pos1, N-1]区间内，找到第F个0，就是最后一个位置pos2。
（3）区间更新[pos1, pos2]，全部置1，表示都插了花。用lazy-tag标记。

4.4 离散化
在树状数组这一节介绍了离散化的小技巧，线段树中有同样的应用。

Mayor’s posters poj 2528
题目描述：有一个海报墙，从左到右共10000000个小块。上面贴了很多海报，这些海报的高度和墙的高度一样，长度不同。贴新海报时，它会覆盖原有的一些旧海报。问所有人贴完海报后，最后在海报墙上能看到多少张海报。注意覆盖的方法，例如海报总长度分成1~4块，海报[1, 4]、[1, 2]、[3, 4]，覆盖的是1_4，12，3~4块，后两张海报完全覆盖了第一张海报，最后能看到2张海报。

输入：第一行是数字c，表示测试用例数。每个测试的第一行是整数n，1<=n<=10000。后面n行，每行表示一张海报，其中第i行是2个整数Li和Ri，表示海报所贴的左右位置，它覆盖墙上的区间[Li, Ri]。1<=Li<=Ri<=10000000。
输出：对每个测试，输出能看到的海报数量。

题解：用线段树求解，是标准的“区间修改+区间查询”。
区间修改：第i次区间修改，把区间[Li, Ri]内的数字改为i，表示第i张海报。如果一个结点表示的区间是同一张海报，用lazy-tag标记。
区间查询：暴力统计区间内有多少个不同的数字，一个数字是一张海报。可以用hash来分辨不同的数字：定义hash[]数组，过滤相同的数字。
本题直接用题目给的[Li, Ri]来划分区间，会超内存。海报墙长度是MAXN = 10M，直接定义tree[MAXN*4]、tag[MAXN*4]，至少需要80M。
观察到题目中只有n = 10000张海报，这10000张海报，只有20000个Li和Ri。用离散化的技巧可以大幅度减少空间，经离散化后MAXN = 20000 = 20k。
离散化时需要注意本题的海报覆盖方法。例如先后贴3张海报[1, 10000000]、[1, 500]、[7000, 10000000]，最后能看到3张海报。其中有4个不同数字1、500、7000、10000000，如果简单地离散化成1、2、3、4，得到新海报[1, 4]、[1, 2]、[3, 4]，只能看到2张海报。错误的原因是把非连续的500、7000离散化成连续的2、3。
正确的离散化方法是：做离散化操作时，如果相邻的数字不是连续的，那么这两个数离散化之后，它们之间应插一个数字。前面例子的正确离散化结果是[1, 7]、[1, 3]、[5, 7]，能看到3张海报。
离散化常常用到几个STL函数：首先用sort()函数对所有的L、R排序，再用unique()函数去重，最后用lower_bound()函数所确定的相对位置作为离散化后的数字。代码见“7. 扫描线”的例题。

5. 区间最值和区间历史最值

区间最值和区间历史最值问题也是线段树的常见考题，它考察一种特殊的情况，即同时做两种操作：修改区间最值、查询区间和。

5.1 区间最值基本题
修改区间最值而是指这样一类操作：给出三个数L、R、x，对区间[L, R]内的每个ai，修改为ai = max(ai, x)或ai = min(ai, x)。
上一节的基础例题都是对区间进行加减，然后再查询区间和，因为修改和查询是相关的，用lazy-tag处理起来很便利。但是对“区间修改最值 + 查询区间和”，能直接用lazy-tag吗？
下面是一个模板题。

Gorgeous Sequence hdu 5306
题目描述：一个长度为n的序列{a1, a2, …, an}，做m次操作，操作有三种：
0 L R x 区间L ≤ i ≤ R内的每个ai，用min(ai, x)替换
1 L R 打印L ≤ i ≤ R区间的最大值ai
2 L R 打印L ≤ i ≤ R区间内所有ai的和
数据范围：n, m ≤ $10^6$

题解：
用线段树解题，肯定要用lazy-tag来实现高效的复杂度，这题如何设计？如果简单地用tag[i] = x表示结点i上的区间最值操作（题目中的0操作），但是它和查询区间和没有关系；如果定义一个tag2[i]来记录区间和，它又与修改区间最值没有直接关系。总之，修改区间最值和查询区间和没有直接联系，不能这么简单地处理。
下面介绍一种区间最值的通用转化方法¹，复杂度O(mlogn)。这种方法定义了4个标记，把区间最值和区间和结合起来。

对线段树的每个结点，定义4个标记：区间和sum、区间最大值ma、严格次大值se（初始值为 -1）、最大值个数t。下面演示它们是如何结合区间最值、区间和的。
首先做区间最值的修改操作“0 L R x”，即用min(ai, x)替换区间[L, R]内的每个ai。根据[L, R]定位到线段树的结点，对区间的每个结点进行暴力搜索，搜到某个结点时，分3种情况：
（1）当ma ≤ x时，这次修改不影响结点，退出；
（2）当se < x < ma时，这次修改值影响最大值，更新sum = sum - t(ma - x) ，以及ma = x，然后打上标记后退出；
（3）当se ≥ x 时，无法直接更新这个结点，递归它的左右儿子。
上述算法的关键是严格次大值se，它起到了“剪枝”的作用。观察下面有10个叶子的线段树，圆圈内标记区间的最大值。如果一个结点的标记值和父亲的标记值相同，把标记删去，最后转化为右图。转化之后，线段树中只有n个标记，在有标记的结点中，父结点的标记值的都大于子树的标记值。维护区间次大值se，相当于维护子树的最大值。检查到某个结点i时，若x大于i的子结点标记值，不用深入；若小于，则需要DFS深入。

图5 最大值和严格次大值的关系

这个算法的复杂度是多少？做一次查询最大值操作“1 L R”或查询区间和操作“2 L R”，显然是O(logn)的，下面讨论做一次修改区间最值时的复杂度。
（1）极端情况1：x比所有元素都大。不用做任何修改，复杂度O(1)。这体现了最大值ma的作用。
（2）极端情况2：x比所有元素都小，区间是全局，L=1，R = n。此时需要更新所有结点的ma = x，复杂度O(nlogn)，然后置所有结点的se = -1。看起来在这种极端情况下复杂度很高，但是如果再做一次更小x的全局修改，由于se = -1，不再需要递归子结点，复杂度O(1)。这体现了严格次大值se的作用。
（3）一般情况。一次区间修改搜到的结点，根据前面对se的讨论，平均是O(logn)的。
m次操作²，总复杂度约为O(mlogn)。下面的代码重现了上面的解释³。

#include<bits/stdc++.h>
using namespace std;
#define ll long long
const int MAXN = 1e6 + 10;
ll sum[MAXN << 2], ma[MAXN << 2], se[MAXN << 2], num[MAXN << 2];//num:区间的最大值个数
ll ls(ll x){ return x<<1;  }     
ll rs(ll x){ return x<<1|1;}      
void pushup(int p) {                     //从下往上传递
    sum[p] = sum[ls(p)] + sum[rs(p)];    //传递区间和
    ma[p] = max(ma[ls(p)], ma[rs(p)]);   //传递区间最大值
    if (ma[ls(p)] == ma[rs(p)]) {      
        se[p] = max(se[ls(p)], se[rs(p)]);
        num[p] = num[ls(p)] + num[rs(p)];
    }
    else {       
        se[p] = max(se[ls(p)],se[rs(p)]);
        se[p] = max(se[p],min(ma[ls(p)], ma[rs(p)]));
        num[p] = ma[ls(p)] > ma[rs(p)] ? num[ls(p)] : num[rs(p)];
    }
}
void build(int p, int pl, int pr) {
    if (pl == pr) {         //叶子
        scanf("%lld", &sum[p]);
        ma[p] = sum[p];  se[p] = -1;  num[p] = 1;
        return;
    }
    ll mid = (pl+pr) >> 1;       
    build(ls(p),pl,mid);         
    build(rs(p),mid+1,pr);       
    pushup(p);
}
void addtag(int p, int x) {
    if (x >= ma[p])    return;
    sum[p] -= num[p] * (ma[p] - x);
    ma[p] = x;
}
void pushdown(int p) {
    addtag(ls(p), ma[p]);  //把标记传给左子树
    addtag(rs(p), ma[p]);  //把标记传给左子树    
}
void update(int L, int R, int p, int pl, int pr, int x) {
    if (x >= ma[p])   return;     //情况（1）
    if (L<=pl && pr<=R && se[p] < x) { addtag(p, x); return;}  //情况（2）
    pushdown(p);                  //情况（3）
    ll mid = (pl+pr) >> 1;       
    if (L<=mid)   update(L, R, ls(p), pl, mid, x);
    if (R>mid)    update(L, R, rs(p), mid+1, pr, x);
    pushup(p);
}
int queryMax(int L, int R, int p, int pl, int pr) {
    if (pl>=L && R >= pr)  return ma[p];
    pushdown(p);
    int res = 0;
    ll mid = (pl+pr) >> 1;       
    if (L<=mid)   res = queryMax(L, R, ls(p), pl, mid);
    if (R>mid)    res = max(res, queryMax(L, R, rs(p), mid+1, pr));
    return res;
}
ll querySum(int L, int R, int p, int pl, int pr) {
    if (L <= pl && R >= pr)   return sum[p];    
    pushdown(p);
    ll res = 0;
    ll mid = (pl+pr) >> 1;       
    if (L<=mid)   res += querySum(L, R, ls(p), pl, mid);
    if (R>mid)    res += querySum(L, R, rs(p), mid+1, pr);
    return res;
}
int main(){
    int T;   scanf("%d", &T);
    while (T--) {
        int n,m; scanf("%d%d", &n, &m);
        build(1, 1, n);
        while (m--) {
            int q, L, R, x;
            scanf("%d%d%d", &q, &L, &R);
            if (q == 0){ scanf("%d", &x); update(L, R, 1, 1, n, x);}
            if (q == 1)  printf("%d\n", queryMax(L, R, 1, 1, n));
            if (q == 2)  printf("%lld\n", querySum(L, R, 1, 1, n));
        }
    }
    return 0;
}

上面介绍了区间最值的基本题，包括修改最值和查询区间和，在这个基础上可以扩展更多的问题⁴，例如：
（1）增加区间修改，把区间统一加上d；
（2）区间最值修改包括最小值、最大值；
（3）给出两个数列A和B，分别修改区间最值，然后求A、B的区间和。

6. 区间合并

线段树非常适合做区间合并。
线段树的兄弟结点之间有相邻关系，这个特性方便线段树做区间合并操作。观察“图1 线段[1, 10]的线段树结构”，发现同一个父结点的左右两个子结点，它们所代表的区间是是相邻的。例如结点4:[1, 3]和兄弟结点5:[4, 5]，它们的区间是相邻的；又例如结点12:[6, 7]和兄弟结点13:[8, 8]是相邻的。利用这个特性，在需要合并区间的时候，只需要从根结点往子树方向深入，就能确定相邻的区间。
下面给出几个例题。

6.1 hdu 1540

Tunnel Warfare hdu 1540
题目描述：在一条线上有连续的n个村庄，两个相邻的村庄之间用地道连接。做m次操作，n, m ≤ 50,000。
操作有三种：
D x 第x个村庄被毁，它的地道也一同被毁
Q x 查询第x个村庄所能到达的村庄总数（包括村庄x）
R 重建刚才被毁的村庄

这个简单题解释了线段树的区间合并如何实现。
把村庄抽象成一个数，正常值为1，被破坏后变成0，题目转换为求最长连续1的个数。第x个村庄所连接的村庄，分为两部分：它左边的能到达的 + 它右边能到达的。
用线段树的“单点修改+区间询问”解题。线段树的结点维护2个信息：
（1）前缀最长1序列。从区间左端点开始的最大连续个数，用pre[]记录。
（2）后缀最长1序列。从区间右端点开始往左的最大的连续个数，用suf[]记录。
下面的图演示了区间合并，左图是线段树的一个父结点和左右儿子，右图是它们的合并关系。

图6 区间合并

右图中pre、suf是父结点的，pre1、suf1是左儿子的，pre2、suf2是右儿子的。它们的合并有以下关系：
（1）若左儿子和右儿子都不满1，有：pre = pre1，suf = suf2；
（2）若左儿子全是1，那么父结点的pre = 左儿子长度 + pre2；
（3）若右儿子全是1，那么父结点的suf = pre1 + 右儿子长度。
下面是代码，请对照图6理解。

#include<bits/stdc++.h>
using namespace std;
const int N = 50010;
int ls(int x){ return x<<1;  }    
int rs(int x){ return x<<1|1;}   
int tree[N<<2], pre[N<<2], suf[N<<2];  //tree:记录元素的值；pre:前缀1的个数；suf：后缀1的个数
int history[N];                        //记录村庄被毁的历史
void push_up(int p,int len){           //len是结点p的长度
    pre[p]=pre[ls(p)];                 //父结点接收子结点的前缀信息
    suf[p]=suf[rs(p)];
    if(pre[ls(p)]==(len-(len>>1)))  pre[p]=pre[ls(p)]+pre[rs(p)]; //左儿子都是1
    if(suf[rs(p)]==(len>>1))        suf[p]=suf[ls(p)]+suf[rs(p)]; //右儿子都是1
}
void build(int p, int pl,int pr){
    if(pl==pr){tree[p]=pre[p]=suf[p]=1;  return;}
    int mid = (pl+pr) >> 1;
    build(ls(p),pl,mid);     
    build(rs(p),mid+1,pr);
    push_up(p,pr-pl+1);
}
void update(int x, int c, int p, int pl, int pr){
    if(pl==pr){ tree[p]=suf[p]=pre[p]=c; return; }   //更新叶子结点信息
    int mid=(pl+pr)>>1;
    if(x<=mid)    update(x,c,ls(p),pl,mid);
    else            update(x,c,rs(p),mid+1,pr);
    push_up(p,pr-pl+1);
}
int query(int x,int p,int pl,int pr){
    if(pl==pr)   return tree[p];    //返回叶子的值
    int mid=(pl+pr)>>1;
    if(x<=mid){                   //左子树
        if(x + suf[ls(p)] > mid)   return suf[ls(p)] + pre[rs(p)];
        else                       return query(x,ls(p),pl,mid);
    }
    else{                           //右子树
        if(mid + pre[rs(p)] >= x)  return pre[rs(p)] + suf[ls(p)];
        else                       return query(x,rs(p),mid+1,pr);
    }
}
int main(){
    int n,m,x,tot;   
    while(scanf("%d%d",&n,&m)>0)    {
        build(1, 1,n);
        tot=0;
        while(m--){
            char op[10]; scanf("%s",op);
            if(op[0]=='Q'){scanf("%d",&x);  printf("%d\n",query(x,1,1,n));}
            else if(op[0]=='D'){
                scanf("%d",&x);
                history[++tot]=x;            //记录毁灭的历史
                update(x,0,1,1,n);
            }
            else {x=history[tot--]; update(x,1,1,1,n); }   //重建
        }
    }
}

6.2 poj 3667

hotel poj 3667
题目描述：旅馆有n个连续的房间，编号从1到n。m个操作，操作有两种：
1 D 入住。查询数量为D的连续房间，并且要最靠左，能找到的话返回这个区间的左端点并占用这些房间，找不到返回0
2 X D 退房。从房间X开始，退出连续长度为D的房间

题解：此题与上一题差不多，用线段树维护最大连续区间长度，区间长度就是对应的房间数目，对应区间中最左边的端点是答案。定义pre维护前缀区间的最大长度，定义suf维护后缀区间的最大长度，定义sum维护最大连续区间长度。

6.3 hdu 3397

Sequence operation hdu 3397
题目描述：一个包含n个字符的序列，字符都是’0’、‘1’。有5种操作：
修改操作：
0 a b 把区间[a , b]所有字符改成’0’
1 a b 把区间[a , b]所有字符改成’1’
2 a b 把区间[a , b]内所有’1’改成’0’，‘1’改成’0’
输出操作Output operations:
3 a b 输出[a, b]内’1’的个数
4 a b 输出[a , b]中最长的连续’1’字符串的长度

（1）对修改操作，这样定义第i个结点的lazy-tag：
tag[i][0] = 1：置0操作，向下传递时将左右区间全部赋值为0
tag[i][1] = 1：置1操作，向下传递时将左右区间全部赋值为1
tag[i][2] = 1：取反操作，向下传递时将左右区间的0变为1， 1变为0
比较特殊的是取反操作。在结点i上，如果已经有置0或置1的tag标记，说明当前区间是全0或全1，但是因为lazy-tag，还没有传递给子孙，则把结点的tag[][0]、tag[][1]的值取反即可。如果没有置0值1标记，只有取反标记，把tag[i][2]和1异或即可。
（2）查询操作3就是查询区间和；查询操作4，与上一个例题一样，定义前缀最长1序列pre和后缀最长1序列suf。

7. 扫描线

扫描线算法是线段树的经典应用，它能解决这些几何问题：矩形面积、矩形周长、多边形面积。

7.1 矩形面积并

Atlantis hdu 1542
题目描述：平面上有一些矩形，它的边都平行于坐标轴。求它们的总面积，重叠的部分只算一次。
输入：有很多组测试，每组测试的第一行是整数n，后面有n行（1 ≤ n≤100），每行用4个实数定义一个矩形：x1，y1，x2，y2 (0 ≤ x1 < x2 ≤ 100000; 0 ≤ y1 < y2 ≤ 100000)，(x1, y1)是矩形左下角，(x2, y2)是右上角。输入以一个单独的0结束。
输出：对每个测试，输出矩形总面积。

用暴力法求总面积：先单独求每个矩形的面积，然后把所有矩形的面积加起来，最后减去任意两个矩形的交集。求矩形交集很花时间，需要两两配对，复杂度 $O(n^2)$ 。
下面用新的方法求面积。图7左图是两个矩形S、T，按从下到上的顺序（也可以从左到右），把两个矩形转为A、B、C三个新矩形，见中间的图，总面积 = A + B + C，这三个矩形没有重叠。通过这个转换，把复杂的重叠问题转化为无重叠的求和问题。

图7 矩形面积和

如何求A、B、C的面积？矩形面积 = 宽 × 高，它们的高很容易知道，原来的两个矩形的4个顶点，把它们的4个y坐标相减，就是A、B、C的高，例如A的高是16 - 11 = 5，B的高是21 - 16 = 5。
比较麻烦的是求A、B、C的宽。能根据原矩形S、T的参数进行计算吗？此时需要引进“入边、出边”的概念，矩形S的“入边”是它下面的边，“出边”是它上面的边。也就是说，遇到一个入边，就进入了一个矩形，遇到一个出边，就离开了一个矩形。对照图7的右图，矩形S的入边是第1条边，出边是第3条边；矩形T的入边是2，出边是4。
在右图中，用P1、P2、P3记录从左到右的三个线段长度，有A宽 = P1 + P2，B宽 = P1 + P2 +P3，C宽 = P2 +P3。求A、B、C的宽，实际上就是判断什么时候用P1、P2、P3来计算。
定义标志Tag1、Tag2、Tag3，分别用来判断是否用P1、P2、P3计算宽度。Tag的初值为0，当遇到入边时，Tag加1，遇到出边，Tag减1。当Tag > 0时，说明在矩形内部，是有效面积，P应该用于计算宽度。
例如P1，从第一条边开始往上走：遇到边1，是入边，Tag1 = 1，说明P1对计算A的宽有效；走到边2，边2不在P1范围内，Tag1不变，P1对计算B的宽仍然有效；边3是出边，Tag1 = 0，P1对计算C的宽无效。
再例如P2，遇到边1，是入边，Tag2 = 1，对计算A有效；走到边2，是入边，Tag2=2，对计算B有效；走到边3，是出边，Tag2 = 1，对计算C有效；走到边4，是出边，Tag2 = 0，不再用于计算。
得到T值，就能计算A、B、C的宽。从第一条边往上走，逐个判断每条边。
（1）求A的宽。到达边1，是入边，有Tag1 = Tag2 = 1，则A宽 = P1 + P2。
（2）求B的宽。到达边2，是入边，有Tag1 = 1，Tag2 = 2，Tag3 = 1，则B宽 = P1 + P2 +P3。
（3）求C的宽。到达边3，是出边，有Tag1 = 0，Tag2 = 1，Tag3 = 1，则C宽 = P2 +P3。
（4）到达边4，是出边，有Tag1 = 0，Tag2 = 0，Tag3 = 0，说明没有矩形了。
整个算法，就是用扫描线从低到高扫过所有矩形，每次扫描都计算其中一层的面积，被称为“扫描线算法”。上面给的矩形例子比较简单，读者可以画一个更复杂的图验证正确性。
以上模型，如何用线段树实现？线段树的一个结点表示一个区间范围，而图7的宽度计算是P1、P2、P3的组合，相当于是区间和。把它画成下面的样子：

图8 转换为线段树

把P1、P2、P3看成线段树的叶子结点，从最下面的第一条线开始往上扫描。一根扫描线，就是线段树的一个结点，结点的值是区间和，就是这条扫描线对应的新矩形的宽度。概况地说，“如果扫到的边是某矩形的入边，则往区间插入这条线段；如果扫到的边是某矩形的出边，则往区间删除这条线段”。
“扫描线算法”用线段树解题需要做离散化。图8中的“树结点1、树结点2、…”是线段树的叶子结点，也就是说，原来的长度“P1、P2、…”在线段树中被处理成了“块”，用“1, 2, …”编号即可。
算法的复杂度是O(mlogn)。
编码时：
（1）读取所有的矩形，记录入边和出边；
（2）对所有的边按y轴排序，确定扫描的顺序；
（3）对x轴做离散化；
（4）按从低到高的顺序，用每个扫描线的线段更新线段树，每个结点的值是这一层扫描线确定的新矩形面积；
（5）对所有新矩形求和。
下面是hdu 1542的代码⁵，它完全重现了上面的解释。注意离散化常用的三个STL函数：sort()、unique()、lower_bound()。

#include<bits/stdc++.h>
using namespace std;
int ls(int x){ return x<<1;  }   
int rs(int x){ return x<<1|1;}    
const int MAXN = 20005;
int Tag[MAXN];         //标志：线段是否有效，能否用于计算宽度
double length[MAXN];   //存放区间i的总宽度
double xx[MAXN];       //存放x坐标值，下标用lower_bound查找

struct ScanLine{       //定义扫描线
    double y;                       //边的y坐标
    double right_x,left_x;          //边的x坐标:右、左
    int inout;                      //入边为1，出边为-1
    ScanLine(){}
    ScanLine(double y,double x2,double x1,int io):y(y),right_x(x2),left_x(x1),inout(io){}
}line[MAXN];
bool cmp(ScanLine &a,ScanLine &b) { return a.y<b.y; }   //y坐标排序

void pushup(int p,int pl,int pr){          //从下往上传递区间值
    if(Tag[p]) length[p] = xx[pr]-xx[pl];//结点的Tag为正，这个线段对计算宽度有效。计算宽度。
    else if(pl+1 == pr)  length[p] = 0;    //叶子结点没有宽度
    else length[p] = length[ls(p)] + length[rs(p)];
}
void update(int L,int R,int io,int p,int pl,int pr){
    if(L<=pl && pr<=R){         //完全覆盖
        Tag[p] += io;             //结点的标志，用来判断能否用来计算宽度
        pushup(p,pl,pr);
        return;
    }
    if(pl+1 == pr) return;                  //叶子结点
    int mid = (pl+pr) >> 1;
    if(L<=mid)  update(L,R,io,ls(p),pl,mid);
    if(R>mid)   update(L,R,io,rs(p),mid,pr); //注意不是mid+1
    pushup(p,pl,pr);
}
int main(){    
    int n, t = 0;
    while(scanf("%d",&n),n){
        int cnt = 0;        //边的数量，包括入边和出边
        while(n--){ 
            double x1,x2,y1,y2; scanf("%lf%lf%lf%lf",&x1,&y1,&x2,&y2);//输入一个矩形
            line[++cnt] = ScanLine(y1,x2,x1,1);      //给入边赋值
            xx[cnt] = x1;                            //记录x坐标
            line[++cnt] = ScanLine(y2,x2,x1,-1);     //给出边赋值
            xx[cnt] = x2;                            //记录x坐标
        }
        sort(xx+1,xx+cnt+1);                         //对所有边的x坐标排序
        sort(line+1,line+cnt+1,cmp);                 //对扫描线按y轴方向从底到高排序
        int num = unique(xx+1,xx+cnt+1)-(xx+1); //离散化操作，用unique去重，返回个数
        memset(Tag,0,sizeof(Tag));
        memset(length,0,sizeof(length));              
        double ans = 0;
        for(int i=1;i<=cnt;++i) {                      //扫描所有入边和出边
            int L,R; 
            ans += length[1]*(line[i].y-line[i-1].y);//累加当前扫描线的面积。面积=宽*高
            L = lower_bound(xx+1,xx+num+1,line[i].left_x)-xx; 
                                           //x坐标离散化：用相对位置代替坐标值
            R = lower_bound(xx+1,xx+num+1,line[i].right_x)-xx;   
            update(L,R,line[i].inout,1,1,num);
        }
        printf("Test case #%d\nTotal explored area: %.2f\n\n",++t,ans);
    }
    return 0;
}

7.2 矩形周长并
下面是“矩形周长并”的模板题。

Picture hdu1828
题目描述：在平面上有很多矩形，可以重叠，它们的边都平行于坐标轴。求所有矩形的并集的边界的长度。下面的左图是矩形，右边是周长。

输入：第一行是整数n，表示矩形数量，后面有n行，每一行用4个整数表示一个矩形的左下角和右上角坐标。n<5000，坐标值范围[-10000,10000]，矩形面积都是正的。
输出：矩形并的周长。

周长问题和面积问题的思路差不多，但是要复杂一些，下面给出两种方法。
（1）做两次扫描。容易想到：总周长 = 横线总长 + 竖线总长。然后用扫描线方法，从低到高扫横线，从左到右扫竖线，做两次扫描就得到了答案。
以横线为例，将横线保存在一个表中，按y坐标排序（升序，从低到高扫描），另外每条横线带一个标记值，原矩形的入边（下边）为1，出边（上边）为-1，对应插入边和删除边。
从低到高扫描横线，每扫到一条横线就计算这部分的横线值。在每个扫描线，“横线的长度 = 当前总区间被覆盖的长度与上一次总区间被覆盖长度之差的绝对值。”因为每添加一条边，如果没有使总区间覆盖长度发生变化，说明这条边在矩形内部，被包含了，不用计算；如果引起总区间长度发生变化，说明该边不被包含，应该计算。
另外，一个矩形的入边（下边）和出边（上边），都应该被计算。上面提到的横线计算方法，“当前总区间长度与上一次总区间长度的差的绝对值”，仍可以用于同一个矩形的入边和出边的计算。当扫描到一个矩形的出边时，要在当前区间中去掉入边，这相当于恢复了出边的计算。如果不能理解，请参考下面的例子。
下图是两个矩形A、B求横线的例子。

图9 从低到高扫描横线

第1条扫描线，是矩形A的入边，插入这个边，现在的总区间是P2 + P3，横线长度 = |P2 + P3| = a；
第2条扫描线，是矩形B的入边，插入这个边，现在的总区间是P1 + P2 + P3，横线长度 = |P1 + P2 + P3 - (P2 + P3)| = P1 = b；
第3条扫描线，是矩形A的出边，删除这个边，现在的总区间是P1 + P2，横线长度 = |P1 + P2 - (P1 + P2 + P3)| = P3 = c；
第4条扫描线，是矩形B的出边，删除这个边，现在的总区间是0，横线长度 = |0 - (P1+P2)| = d。
横线的和 = a + b + c + d。
同理可以计算竖线。
（2）做一次扫描。其实不用做两次扫描，做一次就够了，在扫描横线的同时，计算竖线。
把横线保存在一个表中，按y坐标排序，然后从下往上扫描所有横线。每扫描一条横线，都计算出两种值，一种是横线，一种是竖线。计算横线部分的方法和第（1）种方法一样。如何计算竖线部分?首先，一个矩形的一条入边有2条竖线，添加出边则不会产生竖线；其次，如果两个矩形的入边是连在一起的（矩形重叠），那么也只会产生2条竖线，而不是4条。
这些竖线的长度是是“下一条横线的高度-现在这条横线的高度”。
下面的例子给出了详细解释。

图10 扫描求周长

上图左边给出了两个矩形A、B，从低到高有4条横线。定义num：当前区间有num条独立的边，竖线是2*num个。每增加一条入边有num += 1，每合并一条入边有num -=1，每增加一条出边num -=1。定义sum为总周长。
从低到高扫描横线：
（1）第1条扫描线。增加了一条入边a（a的计算见前面的分析）；num = 1，竖边个数2*num = 2，竖边是2个u。总周长sum = a + 2u。
（2）第2条扫描线。增加了入边b，b和a是合在一起的，所以num = 1保持不变，新的2个竖边是v。更新总周长sum = sum + b + 2v。
（3）第3条扫描线。增加了出边c，c是出边，与入边相减后，还剩下b边，所以num = 1，新的2个竖边是w。更新周长sum = sum + c +2w。
（4）第4条扫描线。增加出边d，num = 0。更新周长sum = sum + d。
下面给出用线段树实现上述算法的代码⁶，代码完全重现了前面的解释。大部分代码与前面求“矩形面积并”的代码一样。

#include<bits/stdc++.h>
using namespace std;
int ls(int x){ return x<<1;  }   
int rs(int x){ return x<<1|1;}  
const int MAXN = 200005;
struct ScanLine {
	int l, r, h, inout;  //inout=1 下边, inout=-1 上边
	ScanLine() {}
	ScanLine(int a, int b, int c, int d) :l(a), r(b), h(c), inout(d) {}
}line[MAXN];
bool cmp(ScanLine &a, ScanLine &b) { return a.h<b.h; }   //y坐标排序

bool lbd[MAXN << 2], rbd[MAXN << 2];//标记这个结点的左右两个端点是否被覆盖（0表示没有，1表示有）
int num[MAXN << 2];    //这个区间有多少条独立的边
int Tag[MAXN << 2];    //标记这个结点是否有效 
int length[MAXN << 2]; //这个区间的有效宽度
void pushup(int p, int pl, int pr) {
	if (Tag[p]) {                 //结点的Tag为正，这个线段对计算宽度有效  
		lbd[p] = rbd[p] = 1;
		length[p] = pr - pl + 1;
		num[p] = 1;               //每条边有两个端点
	}
	else if (pl == pr) length[p]=num[p]=lbd[p]=rbd[p]=0;//叶子结点 
	else {     
		lbd[p] = lbd[ls(p)];      // 和左儿子共左端点
		rbd[p] = rbd[rs(p)];      //和右儿子共右端点
		length[p] = length[ls(p)] + length[rs(p)];
		num[p] = num[ls(p)] + num[rs(p)];
		if (lbd[rs(p)] && rbd[ls(p)]) num[p] -= 1;   //合并边
	}
}
void update(int L, int R, int io, int p, int pl, int pr) {
    if(L<=pl && pr<=R){    //完全覆盖
		Tag[p] += io;
		pushup(p, pl, pr);
		return;
	}
	int mid  = (pl + pr) >> 1;
	if (L<= mid) update(L, R, io, ls(p), pl, mid);
	if (mid < R) update(L, R, io, rs(p), mid+1, pr);
	pushup(p, pl, pr);
}
int main() {
	int n;
	while (~scanf("%d", &n)) {
		int cnt  = 0;
		int lbd = 10000, rbd = -10000;
		for (int i = 0; i < n; i++) {
			int x1, y1, x2, y2;
			scanf("%d%d%d%d", &x1, &y1, &x2, &y2);   //输入矩形
			lbd = min(lbd, x1);                      //横线最小x坐标
			rbd = max(rbd, x2);                      //横线最大x坐标
			line[++cnt] = ScanLine(x1, x2, y1, 1);   //给入边赋值
			line[++cnt] = ScanLine(x1, x2, y2, -1);  //给出边赋值
		}
		sort(line+1, line + cnt+1, cmp);    	   //排序。数据小，不用离散化 
		int ans = 0, last = 0;                     //last：上一次总区间被覆盖长度
		for (int i = 1; i <= cnt ; i++){           //扫描所有入边和出边
			if (line[i].l < line[i].r) 
                update(line[i].l, line[i].r-1, line[i].inout, 1, lbd, rbd-1);
			ans += num[1]*2 * (line[i + 1].h - line[i].h);  //竖线
			ans += abs(length[1] - last);            //横线
			last = length[1];                 
		}
		printf("%d\n", ans);
	}
	return 0;
}

8. 二维线段树

上一节“树状数组”介绍了二维的应用，并用平面几何进行了思维导引。本节介绍的二维线段树，不是一种平面二维几何的关系，而是“树套树”的结构。第一维线段树上的每个结点（代表了一个区间），都单独再建立一棵线段树，即第二维的线段树。
如下图所示的例子，中间是第一维线段树，有7个结点（4个叶子），每个结点单独扩展一个线段树，见虚线圆圈，是第二维线段树。从这个图可以看出，它很耗费空间。设第一维有u个元素，建树需要4u个结点；第二维有v个元素，4v个结点；总结点数量是16uv。

图11 二维线段树

二维线段树如何使用？设题目有两个限制条件x、y，那么用x建立第一维线段树，用y建立第二维线段树。查询同时满足两个区间[xL, xR]、[yL, yR]，首先在第一维线段树上查询区间[xL, xR]，找到符合条件的第一维结点，然后再查询第二维的线段树，找到[yL, yR]。显然，一次查询的复杂度是O(logu∙logv)的。

Luck and Love hdu 1823
题目描述：小w征婚，收到很多MM报名，小w想找到最有缘分的MM。
输入：有多个测试，第一个数字t，表示有t个操作，当t = 0时终止，接下来每行是一个操作。
操作"I"，后面是一个MM的三个参数：整数H表示身高，浮点数A表示活泼度，浮点数L表示缘分。
操作"Q"，后面跟着四个浮点数，H1、H2表示身高区间，A1、A2表示活泼度区间，输出符合身高和活泼度要求的MM中的缘分最高值。
输出：对每次询问，输出缘分最高值，若没有合适的，输出-1。
数据范围：100<=H1，H2<=200， 0.0<=A1，A2，L<=100.0

暴力法：一次询问，逐个检查n个MM，找出符合身高和活泼度的，并记录其中缘分最大值，复杂度是O(n)；m次询问，复杂度是O(mn)。
用“单点修改+区间查询”的二维线段树求解。二维线段树，第一维线段树是身高，第二维是活泼度。另外定义s[][]记录最大缘分，s[i][j]表示第一维结点i、第二维结点j的最大缘分；因为结点i和j分别是身高区间和活泼度区间，所以查询适合的s[][]就得到了答案。复杂度 $O(m(logn)^2)$ 。
下面的代码⁷，请结合图11理解。

#include<bits/stdc++.h>
using namespace std;
int ls(int x){ return x<<1;  }    
int rs(int x){ return x<<1|1;} 
int n=1000, s[1005][4005];      //s[i][j]：身高区间i，活泼区间j的最大缘分
void subBuild(int xp, int p, int pl, int pr) {  //建立第二维线段树：活泼度线段树
    s[xp][p] = -1;
    if(pl == pr) return;
    int mid=(pl+pr)>>1;
    subBuild(xp, ls(p), pl, mid);
    subBuild(xp, rs(p), mid + 1, pr);    
}
void build(int p,int pl, int pr) {              //建立第一维线段树：身高线段树
    subBuild(p, 1, 0, n);
    if(pl == pr) return;
    int mid=(pl+pr)>>1;
    build(ls(p),pl, mid);
    build(rs(p),mid + 1, pr);    
}
void subUpdate(int xp, int y, int c, int p, int pl, int pr) {//更新第二维线段树
    if(pl == pr && pl == y) s[xp][p] = max(s[xp][p], c);
    else {
        int mid=(pl+pr)>>1;
        if(y <= mid) subUpdate(xp, y, c, ls(p), pl, mid);
        else subUpdate(xp, y, c, rs(p), mid + 1, pr);
        s[xp][p] = max(s[xp][ls(p)], s[xp][rs(p)]);
    }
}
void update(int x, int y, int c, int p, int pl, int pr){ //更新第一维线段树：身高x
    subUpdate(p, y, c, 1, 0, n);                         //更新第二维线段树：活泼度y
    if(pl != pr) {
        int mid=(pl+pr)>>1;
        if(x <= mid) update(x, y, c, ls(p), pl, mid);
        else update(x, y, c, rs(p), mid + 1, pr);
    }
}
int subQuery(int xp, int yL, int yR, int p, int pl, int pr) { //查询第二维线段树
    if(yL <= pl && pr <= yR) return s[xp][p];
    else {
        int mid=(pl+pr)>>1;
        int res = -1;
        if(yL <= mid) res = subQuery(xp, yL, yR, ls(p), pl, mid);
        if(yR >  mid) res = max(res, subQuery(xp, yL, yR, rs(p), mid + 1, pr));
        return res;
    }
}
int query(int xL, int xR, int yL, int yR, int p, int pl, int pr) {//查询第一维线段树
    if(xL <= pl && pr <= xR) return subQuery(p, yL, yR, 1, 0, n);  
                                      //满足身高区间时，查询活泼度区间
    else {                             //当前节点不满足身高区间
        int mid = (pl+pr)>>1;
        int res = -1;
        if(xL <= mid) res = query(xL, xR, yL, yR, ls(p), pl, mid);
        if(xR >  mid) res = max(res, query(xL, xR, yL, yR, rs(p), mid + 1, pr));
        return res;
    }
}
int main(){
    int t;
    while(scanf("%d", &t) && t) {        
        build(1,100, 200);
        while(t--) {
            char ch[2];
            scanf("%s", ch);
            if(ch[0] == 'I') {
                int h;double c, d; scanf("%d%lf%lf", &h, &c, &d);
                update(h, c * 10, d * 10, 1, 100, 200);
            } else {
                int xL, xR, yL, yR; double c,d;
                scanf("%d%d%lf%lf", &xL, &xR, &c, &d);
                yL =  c * 10, yR = d * 10;                     //转整数
                if(xL > xR) swap(xL, xR);
                if(yL > yR) swap(yL, yR);
                int ans = query(xL, xR, yL, yR, 1,100, 200);   //x：身高，y：活泼度
                if(ans == -1) printf("-1\n");
                else          printf("%.1f\n", ans / 10.0);
            }
        }
    }
    return 0;
}

【线段树习题】

基本题：hdu 1166，1698，1394，2795；poj 2828，2750，2182，3264。
区间最值：https://darkbzoj.tk/problem/4695
http://uoj.ac/problem/515
历史最值：https://darkbzoj.tk/problem/3064
区间合并：hdu 2871，4553；poj 3225
扫描线：poj 1177, 2482，2464；hdu 1542, 3642，1255，3265 ，3255
二维：poj 1195，2155
综合题：hdu 3974，4718，5756。

参考《区间最值操作与历史最值问题》，2016年信息学奥林匹克中国国家队候选队员论文集，吉如一。在这篇论文中，详细讲解了区间最值的各种操作和解决办法。本书引用了其中的算法思路和基础题目，扩展内容请看这篇论文。 ↩︎
在吉如一的论文中，说明复杂度是O(mlogn)的。 ↩︎
代码改编自：https://blog.csdn.net/nbl97/article/details/76696784 ↩︎
在吉如一的论文中，详细解释了这些扩展问题。 ↩︎
代码改写自：https://blog.csdn.net/narcissus2_/article/details/88418870 ↩︎
代码改写自：https://blog.csdn.net/qq3434569/article/details/78220821 ↩︎
改写自https://www.cnblogs.com/ftae/p/7739512.html ↩︎

线段树 --算法竞赛专题解析（24）