【学习笔记】倍增LCA

LCA问题:给定一颗 \(n\) 个结点的有根树,有 \(m\) 次询问,每次询问给出结点 \(a,b\) ,求 \(a,b\) 的最近公共祖先。此类问题通称 LCA 。


暴力

一次一次把 \(a,b\) 向上提,知道 \(a\)\(b\) 相等为止。

倍增加速

在上面暴力的思想中,是一步一步向上跳的。

倍增的核心思想就是 \(2^j\)\(2^j\) 步向上跳。

我们需要先处理出第 \(i\) 个点的第 \(2^j\) 个祖先。

如何求出?

\(f_{i,j}\) 为第 \(i\) 个点向上跳 \(2^j\) 后所处的位置,根据初一学习的幂的性质,我们认为第 \(i\) 个点向上跳 \(2^j\) 后所处的位置就是第 \(i\) 个点向上跳 \(2^{j-1}\) 后再向上跳 \(2^{j-1}\)\(2^{j-1}+2^{j-1}=2^j\))。

所以我们有:

\[\text{令}x=f_{i,j-1},\text{则} f_{i,j}=f_{x,j-1} \]

可以递推出来:

void dfs(int u, int fa) //当前是第 u 个结点,u 的父亲是 fa
{
    d[u] = d[fa]+1;  /顺便计算深度
    for(int i=1; (1<<i) <= d[u]; i++) //(1<<i)就是 2^i ,枚举2的次幂不能超过当前结点的深度
        f[u][i] = f[ f[u][i-1] ][i-1];
    
    for(int i=head[u]; i; i=nxt[i])
    {
        int v = ver[i];
        if(v == fa) continue;
        f[v][0] = u;
        dfs(v, u);
    }
}

我们有了 \(f\) ,可以干啥呢?

假设要求 \(\text{LCA}(a,b)\)

我们需要先把 \(a,b\) 弄成同一深度,方便待会“一起跳”。

那么为了把 \(a,b\) 弄成同一深度,显然需要把那个深度更深的结点不断向上跳,直到深度等于另一个结点为止。

为了避免麻烦,我们先让 \(a\) 变成那个深度更大的结点即可。不影响最终结果。

我们有代码:

if(d[a]<d[b]) swap(a, b);
    
for(int i=20; i>=0; i--) //2^20足够了。想要省事可以用 log(a) 优化
{
    if(d[f[a][i]] >= d[b]) a = f[a][i];
    //把 a 不断向上跳
    if(a == b) return a;
    //特判。如果两个点相等那么 LCA(a, b) 就是深度小的那个点
}

我们考虑从一个较大的数 \(i\) 作为 \(2\) 的次幂枚举,如果 \(a,b\) 两点的第 \(2^i\) 个祖先(即 \(f_{a,i}\ \text{和}\ f_{b,i}\) )不一样,那么就

\[a=f_{a,i}\ \ \ \ \ b=f_{b,i} \]

也就是 \(a,b\) 同时向上跳 \(2^i\) 步。

这样,在从大到小枚举所有的 \(i\) 之后,当前的 \(a',b'\) 必定是 \(\text{LCA}(a,b)\) 的左右儿子,那么返回一个 \(f_{a',0}\text{或}f_{b',0}\) 即可(即 \(a',b'\) 的父亲)。

注意!这里说的都是从大到小枚举 \(2\) 的次幂,一定要记住,否则这个算法就错了。

我们有求 \(\text{LCA}(a,b)\) 的代码:

int LCA(int a, int b)
{
    if(d[a]<d[b]) swap(a, b);
    
    for(int i=20; i>=0; i--)
    {
        if(d[f[a][i]] >= d[b]) a = f[a][i];
        if(a == b) return a;
    }

    for(int i=20; i>=0; i--)
        if(f[a][i] != f[b][i])
            a = f[a][i], b = f[b][i];
    
    return f[a][0];
    //此处亦可返回 f[b][0] ,答案都一样
}

是不是很简单呢。

考虑为什么倍增 LCA 不会超时。

就像上面说的一样,暴力做法是一步一步往上跳,相当于每次只跳 \(2^0\) 步。

而倍增 LCA 通过从大到小枚举 \(2\) 的次幂,在枚举到每个 \(i\) 时一下会跳 \(2^i\) 次,在倍增中只跳了一次,而在暴力中要跳 \(2^i\) 次!差异可想而知。

接下来谈谈为什么从 \(i=20\) 开始枚举。

如果您多尝试几次,就会发现其实一般数据根本不会用到 \(i=17\) 之前的值!

为什么呢?看下面:

\[2^0=1 \]

\[2^1=2 \]

\[2^2=4 \]

\[2^3=8 \]

\[2^4=16 \]

\[2^5=32 \]

\[2^6=64 \]

\[2^7=128 \]

\[2^8=256 \]

\[2^9=512 \]

\[2^{10}=1024 \]

来观察 \(y=2^x\) 的函数图像:

GrUEin.png

发现了什么?函数 \(y=2^x\) 的增长速度是指数级的!

那么为什么说数据根本不会用到 \(i=17\) 之前的值呢?

\[2^{17}=131072 \]

而在洛谷的 LCA 模板题中,点数 \(n\) 的最大值才为 \(5\times 10^5\)

一般来说,我们可以让 \(i\)\(\log\ a\) 开始枚举。这样会更有效。

顺带一提,由于我们求出 \(f\) 数组需要耗费 \(\mathcal{O}(\log\ n)\) 的复杂度,而真正求 LCA 只需要 \(\mathcal{O}(1)\) 的时间复杂度,故单次查询时间复杂度为 \(\mathcal{O}(\log\ n)\)

考虑为什么倍增 LCA 的正确性。

在倍增 LCA 的算法中,我们发现对于 \(a,b\) 必须满足一个条件:可以拆成任意个 \(2\) 的次幂相加的形式,否则就无法倍增的跳到答案的左、右儿子。

例如说:

\[11=2^3+2^1+2^0 \]

故对于编号为 \(11\) 的点一条可行的路径为:

\[f_{11,3}+f_{11,1}+f_{11,0} \]

由于百度的原因,我们知道了任意一个正整数都可以拆分成 \(2\) 的次幂的形式。故倍增 LCA 是必定正确的。

考虑为什么从大到小枚举 \(2\) 的次幂。

其实很简单。如果从小到大枚举,那么几乎小于 \(x\) (所要求 LCA 的一个值)的任意一个 \(2\) 的次幂都会计入答案。那么是不是就意味着会出现“跳不到答案的左右儿子”这个情况(因为你先跳小的,那么有可能到某个节点(不是答案结点的左右儿子)时 \(2\) 的越来越大的次幂就无法跳了)。

为了避免这种情况,我们就需要从大向小枚举。这样,不能跳的也不会跳。仔细想一想似乎也很符合倍增 LCA 的思想:一次跳很多步。

猜你喜欢

转载自www.cnblogs.com/BlueInRed/p/12644150.html