编辑距离的定义是:从字符串A到字符串B,中间需要的最少操作权重。操作一般包括三种:
删除一个字符
插入一个字符
替换一个字符
编辑距离的算法一般用DP,在DP中可以理解为:
删除A末尾一个字符
用B末尾插入A末尾一个字符
把A末尾字符替换成B末尾的一个字符
def minDistance(word1,word2):
m,n=len(word1),len(word2)
dp=[[0 for _ in range(n+1)] for _ in range(m+1)]
for i in range(m+1):
dp[i][0]=i
for j in range(n+1):
dp[0][j]=j
for i in range(1,m+1):
for j in range(1,n+1):
dp[i][j]=min(dp[i-1][j-1]+(0 if word1[i-1]==word2[j-1] else 1),
dp[i-1][j]+1,
dp[i][j-1]+1,
)
return dp[m][n]
word1="horse"
word2="ros"
print(minDistance(word1,word2))