一、1143. 最长公共子序列

1.1 问题：

给定两个字符串 text1 和 text2，返回这两个字符串的最长公共子序列的长度。

一个字符串的子序列是指这样一个新的字符串：它是由原字符串在不改变字符的相对顺序的情况下删除某些字符（也可以不删除任何字符）后组成的新字符串。

例如，"ace" 是 "abcde" 的子序列，但 "aec" 不是 "abcde" 的子序列。两个字符串的「公共子序列」是这两个字符串所共同拥有的子序列。

若这两个字符串没有公共子序列，则返回 0。

示例 1:

输入：text1 = "abcde", text2 = "ace"

输出：3

解释：最长公共子序列是 "ace"，它的长度为 3。

示例 2:

输入：text1 = "abc", text2 = "abc"

输出：3

解释：最长公共子序列是 "abc"，它的长度为 3。

示例 3:

输入：text1 = "abc", text2 = "def"

输出：0

解释：两个字符串没有公共子序列，返回 0。

1.2 求解：

1）步骤一：定义子问题

要定义子问题，我们还是抓住这样一个子问题的基本性质：子问题是和原问题相似，但规模较小的问题。本体属于二维动态规划题目。

f(i,j) 表示长度为i和j的两个字符串的公共子串长度。

2）写出子问题的递推关系

这一步是求解动态规划问题的关键。二维的子问题有很多可能的递推关系，有些题目一目了然，有些则可能需要仔细推敲。一般来说，我们首先思考能不能使用一种最简单的子问题递推关系：看当前子问题和前一个子问题的关系。如果是一维子问题，就是看 f(i)和 f(i-1)的关系；如果是二维子问题，则是看f(i,j)和f(i-1,j) 、f(i,j-1)、f(i-1,j-1) 的关系。LCS 问题就是这种简单递推关系的代表。

情况一：

情况二：

这样，我们得到的子问题递推关系为：

注意这里涉及到边界值：

3）确定 DP 数组的计算顺序

对于二维动态规划问题，我们仍然要坚持使用 DP 数组，用自底向上的顺序计算子问题。因为 DP 数组中的每一个元素都对应一个子问题，当子问题变成二维之后，DP 数组也需要是二维数组。在 DP 数组中，

Dp[i][j]对应子问题f(i,j)的值。

但是对于二维动态规划问题，我们需要有一定的方法来思考 DP 数组的计算顺序。

DP 数组计算顺序的基本原则是：当我们计算一个子问题时，它所依赖的其他子问题应该已经计算好了。 根据这个原则，我们思考三点内容。

第一点：DP 数组的有效范围是什么？

因此 dp = [[0]*(n+1) for _ in range(m+1)] 。定义数组为[m+1][n+1].

第二点：base case 和原问题在 DP 数组中在什么位置？ 如下图所示，base case 位于 DP 数组的最左侧一列和最上方一行，而原问题则位于 DP 数组的右下角。

第三点：DP 数组的子问题依赖方向是什么？ 观察子问题的递推关系，f(i,j)依赖：f(i-1,j) 、f(i,j-1)、f(i-1,j-1) 。

我们发现，子问题的依赖方向是向右、向下的，因此 DP 数组的计算顺序也应该是从左到右、从上到下。也就是说我们应该以这样的顺序遍历 DP 数组：

for i in range(1,m+1):
for j in range(1,n+1):

具体代码见1.3部分。

4 ）空间优化（可选）

二维动态规划问题的 DP 数组变成了二维数组，空间复杂度更高了。因此，二维动态规划问题也更值得进行空间优化，降低空间复杂度。

不过，二维动态规划问题的空间优化有很多种方法，需要根据不同的情况灵活使用。空间优化的步骤是可选的，优化不优化都可以。本题进行垂直方向压缩，也即是只取n+1维数组，如下图所示，具体代码见1.3部分。

最终变成以下表达式，后续根据这个向右滚动。

last	temp
dp[j-1]	dp[j-1]

需要注意的是，空间优化方法只能优化空间复杂度，不能优化时间复杂度。例如 LCS 问题在空间优化前后的复杂度为：

1.3 代码

1）优化前

class Solution(object):

def longestCommonSubsequence(self, text1, text2):

"""

子问题：

f(i, j) = s[0..i) 和 t[0..j) 的最长公共子序列

f(0, *) = 0

f(*, 0) = 0

f(i, j) = f(i-1, j-1) + 1, if s[i-1] == t[j-1]

max{ f(i-1, j), f(i, j-1) }, otherwise

"""

if not text1 or not text2:

return 0

m = len(text1)

n = len(text2)

dp = [[0]*(n+1) for _ in range(m+1)] #[m+1][n+1]的矩阵

for i in range(1,m+1):

for j in range(1,n+1):

if text1[i-1] == text2[j-1]:

dp[i][j] = 1 + dp[i-1][j-1]

else:

dp[i][j] = max(dp[i-1][j],dp[i][j-1])

return dp[m][n]

2）优化后

class Solution(object):

def longestCommonSubsequence(self, text1, text2):

"""

子问题：

f(i, j) = s[0..i) 和 t[0..j) 的最长公共子序列

f(0, *) = 0

f(*, 0) = 0

f(i, j) = f(i-1, j-1) + 1, if s[i-1] == t[j-1]

max{ f(i-1, j), f(i, j-1) }, otherwise

"""

if not text1 or not text2:

return 0

m = len(text1)

n = len(text2)

dp = [0]*(n+1)

# temp = 0

for i in range(1,m+1):

last = 0

for j in range(1,n+1):

temp =dp[j]

if text1[i-1] == text2[j-1]:

dp[j] = last + 1

else:

dp[j] = max(temp,dp[j-1])

last = temp #向前滚动，temp的值赋值给last

return dp[n]

二、leetcode72. 编辑距离

2.1 问题：

给你两个单词 word1 和 word2，请你计算出将 word1 转换成 word2 所使用的最少操作数。

你可以对一个单词进行如下三种操作：

插入一个字符

删除一个字符

替换一个字符

示例 1：

输入：word1 = "horse", word2 = "ros"

输出：3

解释：

horse -> rorse (将 'h' 替换为 'r')

rorse -> rose (删除 'r')

rose -> ros (删除 'e')

示例 2：

输入：word1 = "intention", word2 = "execution"

输出：5

解释：

intention -> inention (删除 't')

inention -> enention (将 'i' 替换为 'e')

enention -> exention (将 'n' 替换为 'x')

exention -> exection (将 'n' 替换为 'c')

exection -> execution (插入 'u')