「力扣」第 5 题：最长回文子串（暴力解法、中心扩散、动态规划）

解释题意

大家好，这里是「力扣」视频题解第 5 题：最长回文子串。

这道题给我们一个字符串 s，让我们找出这个字符串 s 的最长回文子串，并且告诉我们，s 的最大长度为 1000。

看到这个提示，我们简单计算一下， $1000$ 的平方是 $10$ 的 $6$ 次方，经验告诉我们，可以设计一个大欧 N 方的算法。（这里需要查相关资料说清楚。）

我们看一下示例 1：

给出的字符串是：babad，输出 bab，它是原始字符串的子串，并且 aba 也是一个有效的答案。

示例 2：

输入 cbbd，输出 bb。

由示例，我们可以归纳出回文子串的特点：

1、子串（substring）：在原始字符串中必须是连续的字符，这一点是区别于子序列的，子序列（）只需要保证字符的相对顺序不变，但不要求连续；

2、回文性质（palindromic）：简单说就是从左向右读和从右向左读都是一样的。我们中国人是把回文玩得很 6 的，在古时候，我们就有回文对联和回文诗，有兴趣的朋友可以在网上搜索一下，「力扣」上也有很多关于回文串、回文子序列的问题，大家也不妨做一下。

回文性质从形象上说，就是在回文串的中心位置画一条直线，回文串关于这条直线中心对称。

关于回文，我们知道：

1、单个字符串一定是回文；

回文串可以根据其长度的奇偶性分类：

2、奇数长度的回文串：它的中心正好落在回文串的中间位置；

3、偶数长度的回文串：它的中心是两个相等的字符，也可以认为它的中心是这两个字符中间的空隙。

4、判定是否是回文字符串，可以从两边向中间同步遍历，即使用双指针成对地比较位于字符串前面和后面的字符，只要有一对字符不匹配，这个字符串就不是回文，直到双指针相遇，当且仅当全部匹配的时候，字符串才是回文。

另外一种方法是从回文串的中心开始向两边扩散去匹配，这个方法也很简单，要注意的一点是数组下标不能越界。

方法 1：暴力解法

最直接能够想到的方法是：

枚举 s 的所有子串；
然后逐个判断每个子串的回文性质；
同时记录最长子串；
细节：记录最长子串需要截取，截取有一定性能消耗。替代方式：记录最长回文子串的起始位置 start 和最长回文子串的长度 maxLen，到遍历完成以后，再做截取。

这一版代码交给读者完成。

Java 代码：

public class Solution {

    // 暴力解法

    public String longestPalindrome(String s) {
        int len = s.length();
        if (len < 2) {
            return s;
        }

        int maxLen = 1;
        String res = s.substring(0, 1);

        // 枚举所有长度大于等于 2 的子串
        for (int i = 0; i < len - 1; i++) {
            for (int j = i + 1; j < len; j++) {
                if (j - i + 1 > maxLen && valid(s, i, j)) {
                    maxLen = j - i + 1;
                    res = s.substring(i, j + 1);
                }
            }
        }
        return res;
    }

    private boolean valid(String s, int left, int right) {
        // 验证子串 s[left, right] 是否为回文串
        while (left < right) {
            if (s.charAt(left) != s.charAt(right)) {
                return false;
            }
            left++;
            right--;
        }
        return true;
    }
}

复杂度分析：

时间复杂度： $O(n^3)$ ，这里 $n$ 是字符串的长度，枚举字符串的左边界、右边界是 $O(n^2)$ ，然后继续验证子串是否是回文子串，这一步操作是 $O(n)$ ；
空间复杂度： $O(1)$ ，只使用到常数个临时变量，与字符串长度无关。

方法 2：中心扩散法

刚刚我们提到了判定回文子串的两种方法，其中一种就是从“中心位置”开始判断。
为此，我们还可以枚举所有可能的回文子串所在的中心位置，需要枚举的可能的中心位置一共有 $2 \times n - 1$ 个，在时间复杂度上降低了一个级别。
中心位置可能是一个字符（奇数长度的时候），也可能是两个字符（偶数长度的时候）。
中心位置不论是一个字符，还是两个字符的，其实我们都是用两个指针从中间向两边成对地去判断字符是否相等。可以认为中心是一个字符的时候，是两个指针的重合。
为此可以设计一个统一的方法，兼容这两种情况。

具体的方法是：

1、如果传入重合的索引编码，进行中心扩散，此时得到的回文子串的长度是奇数；

2、如果传入相邻的索引编码，进行中心扩散，此时得到的回文子串的长度是偶数。

下面我们看一下代码：

Java 代码：

public class Solution2 {

    // 中心扩散法

    public String longestPalindrome(String s) {
        int len = s.length();
        if (len < 2) {
            return s;
        }
        int maxLen = 1;
        int start = 0;
        // 中心位置枚举到 len - 2 即可
        for (int i = 0; i < len - 1; i++) {
            int oddLen = expandAroundCenter(s, i, i);
            // System.out.println("oddLen：" + oddLen);
            int evenLen = expandAroundCenter(s, i, i + 1);
            // System.out.println("evenLen：" + evenLen);

            int curMaxLen = Math.max(oddLen, evenLen);
            if (curMaxLen > maxLen) {
                maxLen = curMaxLen;
                start = i - (maxLen - 1) / 2;
            }
        }
        return s.substring(start, start + maxLen);
    }

    /**
     * 回文串的长度
     * @param s
     * @param left
     * @param right
     * @return
     */
    private int expandAroundCenter(String s, int left, int right) {
        // left = right 的时候，此时回文中心是一个字符，回文串的长度是奇数
        // right = left + 1 的时候，此时回文中心两个字符，回文串的长度是偶数
        int len = s.length();
        int i = left;
        int j = right;
        while (i >= 0 && j < len) {
            if (s.charAt(i) == s.charAt(j)) {
                i--;
                j++;
            } else {
                break;
            }
        }
        // 这里要小心，跳出 while 循环时，恰好满足 s.charAt(i) != s.charAt(j)，
        // 此时回文串的长度是 j - i
        return j - i - 1;
    }
}

复杂度分析：

时间复杂度： $O(n^{2})$ ，枚举中心位置有 $2N$ 个（这里我们没有分析得特别细致），每一次向两边扩散检测是否回文，时间复杂度都是 $O(n)$ 。
空间复杂度： $O(1)$ ，只使用到常数个临时变量，与字符串长度无关。

方法 3：动态规划

能想到“动态规划”解法，是因为“回文串”是天然具有“状态转移”性质的：

一个回文去掉两头以后，剩下的部分依然是回文（这里暂不讨论边界）。

因此，我们可以使用“动态规划”的方法快速判断一个子串是否是回文子串。“动态规划”的方法，在判断子串的过程中使用，参考子串的子串是否是回文的结果。

“动态规划”最关键的步骤是想清楚“状态如何转移”，我们依然从回文串的定义展开讨论：

1、如果一个字符串的头尾两个字符都不相等，那么这个字符串一定不是回文串；

2、如果一个字符串的头尾两个字符相等，才有必要继续判断下去：

（1）如果里面的子串是回文，整体就是回文串；

（2）如果里面的子串不是回文串，整体就不是回文串。

即在头尾字符相等的情况下，里面子串的回文性质据定了整个子串的回文性质，这就是状态转移。于是我们把“状态”定义为原字符串的一个子串是否为回文子串。

第 1 步：定义状态

dp[i][j] ：子串 s[i, j] 是否为回文子串，这里 i 和 j 分别表示字符串 s 的左右边界，并且是可以取到的。

第 2 步：思考状态转移方程

根据上面的分析，不难得到状态转移方程：

dp[i][j] = (s[i] == s[j]) and dp[i + 1][j - 1]

先判断左右边界所指向的字符是否相等，如果不相等，就直接下结论，子串不是回文串。如果相等，我们就看去掉了头和尾的那个子串是否是回文子串。注意，这里的逻辑运算符，我们用的是 and，它有短路的功能。

对于我们这个问题，“动态规划”实际上是在填一张二维表格，i 和 j 的关系是 i <= j ，因此，只需要填这张表的上半部分；

看到 dp[i + 1][j - 1] 就得考虑边界情况。

边界条件是：以 i + 1 为左边界和以 j - 1 为右边界的子串，长度小于等于 1，因为我们之前说过，单个字符一定是回文串。即在严格小于 2的情况下，计算不等式 j - 1 - (i + 1) + 1 < 2 ，整理得 j - i < 3。

这个结论很显然：当子串 s[i, j] 的长度等于 2 或者等于 3 的时候，我其实只需要判断一下头尾两个字符是否相等就可以直接下结论了。

如果子串 s[i + 1, j - 1] 只有 1 个字符，即去掉两头，剩下中间部分只有 $1$ 个字符，当然是回文；
如果子串 s[i + 1, j - 1] 为空串，那么子串 s[i, j] 一定是回文子串。

因此，在 s[i] == s[j] 成立和 j - i < 3 的前提下，直接可以下结论，dp[i][j] = true，否则才执行状态转移。

（这一段看晕的朋友，直接看代码吧。我写晕了，车轱辘话来回说。）

第 3 步：考虑初始化

初始化的时候，单个字符一定是回文串，因此把对角线先初始化为 1，即 dp[i][i] = 1 。

事实上，初始化的部分都可以省去。因为只有一个字符的时候一定是回文，dp[i][i] 根本不会被其它状态值所参考。

第 4 步：考虑输出

只要一得到 dp[i][j] = true，就记录子串的长度和起始位置，没有必要截取，因为截取字符串也要消耗性能，记录此时的回文子串的“起始位置”和“回文长度”即可。

第 5 步：考虑状态是否可以压缩

因为在填表的过程中，只参考了左下方的数值。事实上可以压缩，但会增加一些判断语句，增加代码编写和理解的难度，丢失可读性。在这里不做状态压缩。

下面是编码的时候要注意的事项：总是先得到小子串的回文判定，然后大子串才能参考小子串的判断结果。

思路是：

1、在子串右边界 j 逐渐扩大的过程中，枚举左边界可能出现的位置；

2、左边界枚举的时候可以从小到大，也可以从大到小。

这两版代码的差别仅在内层循环，希望大家能够自己动手，画一下表格，思考为什么这两种代码都是可行的，相信会对“动态规划”作为一种“表格法”有一个更好的理解。

Java 代码：

public class Solution {

    // 动态规划

    public String longestPalindrome(String s) {
        int len = s.length();
        if (len < 2) {
            return s;
        }

        boolean[][] dp = new boolean[len][len];

        for (int i = 0; i < len; i++) {
            dp[i][i] = true;
        }

        int maxLen = 1;
        int start = 0;

        for (int right = 1; right < len; right++) {
            for (int left = 0; left < right; left++) {
                if (s.charAt(left) != s.charAt(right)) {
                    dp[left][right] = false;
                } else {
                    if (right - left <= 2) {
                        dp[left][right] = true;
                    } else {
                        dp[left][right] = dp[left + 1][right - 1];
                    }
                }

                if (dp[left][right]) {
                    int curLen = right - left + 1;
                    if (curLen > maxLen) {
                        maxLen = curLen;
                        start = left;
                    }
                }
            }
        }
        return s.substring(start, start + maxLen);
    }
}

复杂度分析：

时间复杂度： $O(n^{2})$ 。
空间复杂度： $O(n^{2})$ ，二维 dp 问题，一个状态得用二维有序数对表示，因此空间复杂度是 $O(n^{2})$ 。

这个方法在实际运行起来，会比中心扩展法要慢，这是因为：

“动态规划”方法，实际上是“暴力解法”的优化，在判断是否回文这一步，我们“用空间换时间”，把时间复杂度降低了一个数量级；
而“中心扩散法”在枚举的中心数量上，比“暴力解法”要少一个数量级；
因此，中心扩散法在执行时间上较快于动态规划方法，但它们本质上都是 $O(n^{2})$ 时间复杂度的算法，执行时间不一样是因为 $n^{2}$ 前面那个系数不一样。

最后要向大家提及的是，“最长回文子串”还有线性时间复杂度的算法，这是由著名计算机科学家 Manacher 发明的，这个方法是专门用于解决“最长回文子串”问题的算法，有兴趣的朋友可以在网络上或者是本题的题解区搜索 Manacher 算法的解释，这个算法充分利用回文子串的对称性，也是采用“以空间换时间”的思路，在 $O(n)$ 的时间复杂度内完成了最长回文子串的搜索。