LCA算法解析-Tarjan&倍增&RMQ

原文链接http://www.cnblogs.com/zhouzhendong/p/7256007.html

UPD(2018-5-13) : 细节修改以及使用了Latex代码，公式更加美观。改的过程中发现许多叙述上的问题，已经修改。然而得到这么多阅读量我真的是受宠若惊。于是我决定再补写一个在线O(1)O(1)查询的RMQRMQ算法。

问题模型

　　对于一棵树，求两个节点的最近公共祖先（LCALCA）。

　　如下图：（以下数字代表对应编号的节点）

　　11和66的LCALCA是88

　　1111和11的LCALCA是88

　　1111和1515的LCALCA是44

　　1414和1313的LCALCA是11

LCA_TarjanLCA_Tarjan

　　LCALCA的TarjanTarjan算法的时间复杂度为O(n+q)O(n+q)，是一种离线算法，要用到并查集。

　　TarjanTarjan算法基于dfsdfs，在dfsdfs的过程中，对于每个节点位置的询问做出相应的回答。

　　dfsdfs的过程中，当一棵子树被搜索完成之后，就把他和他的父亲合并成同一集合；在搜索当前子树节点的询问时，如果该询问的另一个节点已经被访问过，那么该编号的询问是被标记了的，于是直接输出当前状态下，另一个节点所在的并查集的祖先；如果另一个节点还没有被访问过，那么就做下标记，继续dfsdfs。

扫描二维码关注公众号，回复： 2528848 查看本文章

　　当然，暂时还没那么容易弄懂，所以建议结合下面的例子和标算来看看。

（下面的集合合并都用并查集实现）

　　比如：8−1−14−138−1−14−13,此时已经完成了对子树11的子树1414的dfsdfs与合并（1414子树的集合与11所代表的集合合并），如果存在询问(13,14)(13,14)，则其LCALCA即getfather(14)getfather(14)，即11；如果还存在由节点1313与已经完成搜索的子树中的节点的询问，那么处理完。然后合并子树1313的集合与其父亲11当前的集合，回溯到子树11，并深搜完所有11的其他未被搜索过的儿子，并完成子树11中所有节点的合并，再往上回溯，对节点11进行类似的操作即可。

#include <cstring>
#include <cstdio>
#include <algorithm>
#include <cstdlib>
#include <cmath>
using namespace std;
const int N=40000+5;
struct Edge{
    int cnt,x[N],y[N],z[N],nxt[N],fst[N];
    void set(){
        cnt=0;
        memset(x,0,sizeof x);
        memset(y,0,sizeof y);
        memset(z,0,sizeof z);
        memset(nxt,0,sizeof nxt);
        memset(fst,0,sizeof fst);
    }
    void add(int a,int b,int c){
        x[++cnt]=a;
        y[cnt]=b;
        z[cnt]=c;
        nxt[cnt]=fst[a];
        fst[a]=cnt;
    }
}e,q;
int T,n,m,from,to,dist,in[N],rt,dis[N],fa[N],ans[N];
bool vis[N];
void dfs(int rt){
    for (int i=e.fst[rt];i;i=e.nxt[i]){
        dis[e.y[i]]=dis[rt]+e.z[i];
        dfs(e.y[i]);
    }
}
int getf(int k){
    return fa[k]==k?k:fa[k]=getf(fa[k]);
}
void LCA(int rt){
    for (int i=e.fst[rt];i;i=e.nxt[i]){
        LCA(e.y[i]);
        fa[getf(e.y[i])]=rt;
    }
    vis[rt]=1;
    for (int i=q.fst[rt];i;i=q.nxt[i])
        if (vis[q.y[i]]&&!ans[q.z[i]])
            ans[q.z[i]]=dis[q.y[i]]+dis[rt]-2*dis[getf(q.y[i])];
}
int main(){
    scanf("%d",&T);
    while (T--){
        q.set(),e.set();
        memset(in,0,sizeof in);
        memset(vis,0,sizeof vis);
        memset(ans,0,sizeof ans);
        scanf("%d%d",&n,&m);
        for (int i=1;i<n;i++)
            scanf("%d%d%d",&from,&to,&dist),e.add(from,to,dist),in[to]++;
        for (int i=1;i<=m;i++)
            scanf("%d%d",&from,&to),q.add(from,to,i),q.add(to,from,i);
        rt=0;
        for (int i=1;i<=n&&rt==0;i++)
            if (in[i]==0)
                rt=i;
        dis[rt]=0;
        dfs(rt);
        for (int i=1;i<=n;i++)
            fa[i]=i;
        LCA(rt);
        for (int i=1;i<=m;i++)
            printf("%d\n",ans[i]);
    }
    return 0;
}

倍增

　　我们可以用倍增来在线求LCALCA，时间和空间复杂度分别是O((n+q)logn)O((n+q)log⁡n)和O(nlogn)O(nlog⁡n)。

　　对于这个算法，我们从最暴力的算法开始：

　　　　①如果aa和bb深度不同，先把深度调浅，使他变得和浅的那个一样

　　　　②现在已经保证了aa和bb的深度一样，所以我们只要把两个一起一步一步往上移动，直到他们到达同一个节点，也就是他们的最近公共祖先了。

#include <cstring>
#include <cstdio>
#include <cstdlib>
#include <algorithm>
#include <cmath>
#include <vector>
using namespace std;
const int N=10000+5;
vector <int> son[N];
int T,n,depth[N],fa[N],in[N],a,b;
void dfs(int prev,int rt){
    depth[rt]=depth[prev]+1;
    fa[rt]=prev;
    for (int i=0;i<son[rt].size();i++)
        dfs(rt,son[rt][i]);
}
int LCA(int a,int b){
    if (depth[a]>depth[b])
        swap(a,b);
    while (depth[b]>depth[a])
        b=fa[b];
    while (a!=b)
        a=fa[a],b=fa[b];
    return a;
}
int main(){
    scanf("%d",&T);
    while (T--){
        scanf("%d",&n);
        for (int i=1;i<=n;i++)
            son[i].clear();
        memset(in,0,sizeof in);
        for (int i=1;i<n;i++){
            scanf("%d%d",&a,&b);
            son[a].push_back(b);
            in[b]++;
        }
        depth[0]=-1;
        int rt=0;
        for (int i=1;i<=n&&rt==0;i++)
            if (in[i]==0)
                rt=i;
        dfs(0,rt);
        scanf("%d%d",&a,&b);
        printf("%d\n",LCA(a,b));
    }
    return 0;
}

　　而实际上，一步一步往上移动太慢，我们可以做一个预处理：

　　fai,jfai,j表示节点ii往上走2j2j次所到达的祖先，那么不难写出转移式：

　　　　　　fai,0=fatheri,fai,j=fafai,j−1,j−1fai,0=fatheri,fai,j=fafai,j−1,j−1

　　然后在求LCALCA的时候，有这样一个性质：（假设aa和bb深度一样）

　　设anstx,yanstx,y为节点x网上走y步到达的祖先，对于一个kk，如果ansta,k=anstb,kansta,k=anstb,k,那么对于所有k′(k′>k)k′(k′>k)，一定有ansta,k′=anstb,k′ansta,k′=anstb,k′；对于一个kk，如果ansta,k≠anstb,kansta,k≠anstb,k,那么对于所有k′(k′<k)k′(k′<k)，一定有ansta,k′≠anstb,k′ansta,k′≠anstb,k′,而且LCA(a,b)=LCA(ansta,k,anstb,k)LCA(a,b)=LCA(ansta,k,anstb,k)。
于是求法就渐渐的现行了：

　　1. 把aa和bb移到同一深度（设depthxdepthx为节点xx的深度），假设deptha≤depthbdeptha≤depthb,所以我们的目的是把bb向上移动i=(depthb−deptha)i=(depthb−deptha)层，那么，由于之前有预处理的fafa数组，我们把ii写成二进制形势，然后利用fafa数组来在O(logn)O(log⁡n)的复杂度中完成；

　　2. 寻找aa和bb的LCALCA下一层的两个祖先。利用之前的那个性质，再利用倍增，如果aa和bb的第2k2k个祖先不是同一个，那么把aa改为faa,kfaa,k,bb改为fab,kfab,k,kk减11;否则直接kk减11；当然在这之前要实现确定kk的最大值，从大往小处理下去。最终的结果就是faa,0faa,0或者fab,0fab,0。

　　注意,如果aa和bb在调节深度之后已经是同一个祖先的，那么直接返回aa或者bb。

　　UPD(2018-07-12): LCA倍增关键部分模板更新

#include <cstring>
#include <cstdio>
#include <cstdlib>
#include <algorithm>
#include <cmath>
#include <vector>
using namespace std;
const int N=10000+5;
vector <int> son[N];
int T,n,depth[N],fa[N][20],in[N],a,b;
void dfs(int prev,int rt){
    depth[rt]=depth[prev]+1;
    fa[rt][0]=prev;
    for (int i=1;i<20;i++)
        fa[rt][i]=fa[fa[rt][i-1]][i-1];
    for (int i=0;i<son[rt].size();i++)
        dfs(rt,son[rt][i]);
}
int LCA(int x,int y){
    if (depth[x]<depth[y])
        swap(x,y);
    for (int i=19;i>=0;i--)
        if (depth[x]-(1<<i)>=depth[y])
            x=fa[x][i];
    if (x==y)
        return x;
    for (int i=19;i>=0;i--)
        if (fa[x][i]!=fa[y][i])
            x=fa[x][i],y=fa[y][i];
    return fa[x][0];
}
int main(){
    scanf("%d",&T);
    while (T--){
        scanf("%d",&n);
        for (int i=1;i<=n;i++)
            son[i].clear();
        memset(in,0,sizeof in);
        for (int i=1;i<n;i++){
            scanf("%d%d",&a,&b);
            son[a].push_back(b);
            in[b]++;
        }
        depth[0]=-1;
        int rt=0;
        for (int i=1;i<=n&&rt==0;i++)
            if (in[i]==0)
                rt=i;
        dfs(0,rt);
        scanf("%d%d",&a,&b);
        printf("%d\n",LCA(a,b));
    }
    return 0;
}

RMQRMQ

　　现在来介绍一种O(nlogn)O(nlog⁡n)预处理，O(1)O(1)在线查询的算法。

　　RMQRMQ的意思大概是“区间最值查询”。顾名思义，用RMQRMQ来求LCALCA是通过RMQRMQ来实现的。

　　首先，您可以了解一下dfsdfs序。链接：http://www.cnblogs.com/zhouzhendong/p/7264132.html

　　在dfsdfs的过程中，退出一个子树之后就不会再进入了。这是个很好的性质。

　　所以很显然，一个子树中深度最浅的节点必定是该子树的树根。

　　显然，两个节点的LCALCA不仅是两个节点的最近公共祖先，而且是囊括这两个节点的最小子树的根，即囊括这两个节点的最小子树中的深度最小的节点。

　　我们来想一想如何得到这个节点。

　　现在，我们稍微修改一下dfsdfs序，搞一个欧拉序。

　　欧拉序，就是每次从father(x)father(x)进入节点xx或者从子节点回溯到xx都要把xx这个编号扔到一个数组的最后。

　　这样最终会得到一个长度约为2n2n的数列。（考虑每一个节点贡献为22，分别是从其父亲进入该节点，和从该节点回到其父亲）

　　例如，上图这棵树的一个欧拉序为8,5,9,5,8,4,6,15,6,7,6,4,10,11,10,16,3,16,12,16,10,2,10,4,8,1,14,1,13,1,88,5,9,5,8,4,6,15,6,7,6,4,10,11,10,16,3,16,12,16,10,2,10,4,8,1,14,1,13,1,8。

　　建议跟着我给出的欧拉序走一遍，再次理解欧拉序的含义。

　　再注意到，一对点的LCALCA不仅是囊括这两个节点的最小子树中的深度最小的节点，还是连接这对点的简单路径上深度最小的点。

　　而且从离开aa到进入bb的这段欧拉序必然包括所有这对点之间的简单路径上的所有点，所以我们考虑求得这段欧拉序中所包含的节点中的深度最小的点即其LCALCA。

　　从aa到bb的这段欧拉序会包含这棵子树中的其他节点，但是不会影响这个最浅点的求得，因为“一对点的LCALCA是囊括这两个节点的最小子树中的深度最小的节点”。

　　显然，aa到bb这段欧拉序是个连续区间。

　　你可以用线段树维护，但是线段树太lowlow了。

　　现在我们考虑通过预处理来O(1)O(1)获得这个最浅点。

　　于是我们要学习一个叫做STST表的东西来搞定这个。（和之前倍增中处理的fafa数组差不多）

　　我再放一篇大佬博客来介绍RMQRMQ与STST表：　　https://blog.csdn.net/qq_31759205/article/details/75008659

　　接下来当然是轻松愉快的放代码时间啦。

//CodeVS2370
#include <bits/stdc++.h>
#define time _____time
using namespace std;
const int N=50005;
struct Gragh{
    int cnt,y[N*2],z[N*2],nxt[N*2],fst[N];
    void clear(){
        cnt=0;
        memset(fst,0,sizeof fst);
    }
    void add(int a,int b,int c){
        y[++cnt]=b,z[cnt]=c,nxt[cnt]=fst[a],fst[a]=cnt;
    }
}g;
int n,m,depth[N],in[N],out[N],time;
int ST[N*2][20];
void dfs(int x,int pre){
    in[x]=++time;
    ST[time][0]=x;
    for (int i=g.fst[x];i;i=g.nxt[i])
        if (g.y[i]!=pre){
            depth[g.y[i]]=depth[x]+g.z[i];
            dfs(g.y[i],x);
            ST[++time][0]=x;
        }
    out[x]=time;
}
void Get_ST(int n){
    for (int i=1;i<=n;i++)
        for (int j=1;j<20;j++){
            ST[i][j]=ST[i][j-1];
            int v=i-(1<<(j-1));
            if (v>0&&depth[ST[v][j]]<depth[ST[i][j]])
                ST[i][j]=ST[v][j];
        }
}
int RMQ(int L,int R){
    int val=floor(log(R-L+1)/log(2));
    int x=ST[L+(1<<val)-1][val],y=ST[R][val];
    if (depth[x]<depth[y])
        return x;
    else
        return y;
}
int main(){
    scanf("%d",&n);
    for (int i=1,a,b,c;i<n;i++){
        scanf("%d%d%d",&a,&b,&c);
        a++,b++;
        g.add(a,b,c);
        g.add(b,a,c);
    }
    time=0;
    dfs(1,0);
    depth[0]=1000000;
    Get_ST(time);
    scanf("%d",&m);
    while (m--){
        int x,y;
        scanf("%d%d",&x,&y);
        if (in[x+1]>in[y+1])
            swap(x,y);
        int LCA=RMQ(in[x+1],in[y+1]);
        printf("%d\n",depth[x+1]+depth[y+1]-depth[LCA]*2);
    }
    return 0;
}

听说有人认为应该加个重链剖分做法？？？？

我认为单纯求LCA没必要写树链剖分，所以这里不展开介绍。如果您感兴趣，那百度一下，你就知道。

练习题

POJ1330
HDU2586
CodeVS2370
POJ1470
HDU4547