-
算法策略 : 动态规划(Dynamic Programming)
- 最长公共子串(Longest Common Substring)
- 子串是连续的子序列
求两个字符串的最长公共子串长度
ABCBA和BABCA的最长公共子串是ABC,长度为3
思路
- 假设2个字符串分别是str1、str2
- i ∈ [1, str1.length]
- j ∈ [1, str2.length]
- 假设dp(i, j)是以 str1[i - 1]、str2[j - 1] 结尾的最长公共子串长度
- dp(i, 0)、dp(0, j)初始值均为0
- 如果str1[i - 1] = str2[j - 1],那么dp(i, j) = dp(i - 1, j - 1) + 1
- 如果str1[i - 1] != str2[j - 1],那么dp(i, j) = 0
- 最长公共子串的长度是所有dp(i, j)中最大的max { dp(i, j) }
实现
int lcs(String str1, String str2) {
if (str1 == null || str2 == null) return 0;
char[] cs1 = str1.toCharArray();
if (cs1.length == 0) return 0;
char[] cs2 = str2.toCharArray();
if (cs2.length == 0) return 0;
int[][] dp = new int[cs1.length + 1][cs2.length + 1];
int max = 0;
for (int i = 1; i <= cs1.length; i++) {
for (int j = 1; j <= cs2.length; j++) {
if (cs1[i - 1] != cs2[j - 1]) continue;
dp[i][j] = dp[i - 1][j - 1] + 1;
max = Math.max(max, dp[i][j]);
}
}
return max;
}
- dp数组的计算结果如下所示
一维数组实现
int lcs(String str1, String str2) {
if (str1 == null || str2 == null) return 0;
char[] cs1 = str1.toCharArray();
if (cs1.length == 0) return 0;
char[] cs2 = str2.toCharArray();
if (cs2.length == 0) return 0;
char[] rowStr = cs1, colsStr = cs2;
if (cs1.length < cs2.length) {
rowStr = cs2;
colStr = cs1;
}
int[] dp = new int[colStr + 1];
int max = 0;
for (int i = 1; i <= rowStr.length; i++) {
for (int j = colstr.length; j >= 1; j++) {
if (rowStr[i - 1] == colStr[j - 1]) {
dp[j] = dp[j - 1] + 1;
} else {
dp[j] = 0;
}
max = Math.max(max, dp[i][j]);
}
}
return max;
}
- 空间复杂度:O(k),k = min { n, m }
- 时间复杂度:O(n * m)