levenshtein 距离 python实现 - 代码天地

levenshtein 距离 python实现

其他 2018-08-11 00:36:14 阅读次数: 0

参考了博客

对于编辑距离，我做了很详细的解释，具体如下：

import numpy as np

"""
此为编辑距离，就是str1转化为str2的编辑距离
采用的就是动态规划思想
举例说明，我们以 str1="leensh"，str2="levensh"为例，首先得到的结果为：
      l e v e n s h
[[0. 1. 2. 3. 4. 5. 6. 7.]
l [1. 0. 1. 2. 3. 4. 5. 6.]
e [2. 1. 0. 1. 2. 3. 4. 5.]
e [3. 2. 1. 1. 1. 2. 3. 4.]
n [4. 3. 2. 2. 2. 1. 2. 3.]
s [5. 4. 3. 3. 3. 2. 1. 2.]
h [6. 5. 4. 4. 4. 3. 2. 1.]]
首先第一个字符完全一致，所以矩阵[1,1]为0，不需要更改，如果[1,2],[1,3],...[1,7]都做改变，距离一次累加，相当于，不管以后的字符，只管
str1只有一个字符l的情况下，变成str2的方法，需要把后边全部变化成str2对应的字符串，所以【1,2】，..,[1,7]依次累计，同理
当第二行，[2,1],认为str2，只有l的时候，由于第一个字符相同，所以str2变成str1只需当前1个过程，【2,2】为0，由于前两个字符相同，同理[2,3],...
[2,7]，当在第3行时，【3,3】为1，但是[3,4]为什么也为1，这个是关键，变成[3,4],有三个可能，[2,4],[3,3],[2,3],由于最小积累在，[3,3],[2,3]对应的
待匹配字符串分别为lev ，lev，，但是[3,3]进入到[3,4],需要添加e，这样总代价变成了[3,3]+1=2,而[2,3]当前字符串为lev,我们提供的【2,3】变成第3行
添加了一个e所以，与待匹配e相同，没有变化，所以总代价还是1，而[3,3]已经把给的e变成了v，所以到第4步，需要重新添加e，所以代价为2，依次剩余字符串相同
所以总代价为1，他只需添加了一个
"""
def distance_str(str1,str2):
    dp=np.zeros((len(str1)+1,len(str2)+1))
    m=len(str1)
    n=len(str2)
    for k in range(1,m+1):
        dp[k][0]=k
    for k in range(1,n+1):
        dp[0][k]=k
    for k in range(1,m+1):
        for j in range(1,n+1):
            dp[k][j]=min(dp[k-1][j],dp[k][j-1])+1 #这里表示上边和下边的数值最小数值
            if str1[k-1]==str2[j-1]:
                dp[k][j]=min(dp[k][j],dp[k-1][j-1])
            else:
                dp[k][j]=min(dp[k][j],dp[k-1][j-1]+1)
    print(dp)

if __name__ == '__main__':
    str1="leensh"
    str2="levensh"

猜你喜欢

转载自blog.csdn.net/chenmingwei000/article/details/80605733

levenshtein 距离 python实现

Levenshtein距离及其python实现

Levenshtein编辑距离C++实现

Levenshtein距离算法详解

Levenshtein distance（编辑距离）

编辑距离（levenshtein distance）C语言实现

windows下安装python-Levenshtein，计算编辑距离

Levenshtein Distance编辑距离算法

编辑距离：Levenshtein Distance算法

Levenshtein distance 编辑距离算法

编辑距离 (Levenshtein Distance算法)

Levenshtein距离 -----字符串编辑距离

最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现

[最详细]最短编辑距离的原理解释与Java代码实现(Minimum Edit Distance,Levenshtein距离,代码)

相似度：编辑距离--Levenshtein Distance

编辑距离算法详解：Levenshtein Distance算法

Levenshtein Distane (莱文斯坦距离)

详解编辑距离算法-Levenshtein Distance

Levenshtein字符串编辑距离算法

相似度算法——Levenshtein(编辑距离)

动态规划 - The Levenshtein Distance 编辑距离

Levenshtein Distance 算法实现

Levenshtein python调用

编辑距离——莱文斯坦距离（Levenshtein distance）

字符串编辑距离（Levenshtein距离）算法

Levenshtein

[python]My Unique JsonDiff算法——如何计算2个json串之间的差距并Diff出来（一）：编辑距离（Levenshtein）算法

2020年华为春招真题(最短编辑距离)详解+Java代码实现(校招,Minimum Edit Distance,Levenshtein距离,代码,原理解释)

Damerau–Levenshtein Distance的java实现

python Levenshtein.ratio的java实现

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

laravle中orm简单的增删改查

文本分类特征选取之CHI开方检验

Spark核心编程-WordCount

大数据开发实战系列之电信客服(1)

读书笔记 - 把时间当作朋友 by 李笑来

python 笔记--if else

SpringBoot/Mybatis/Druid, 多数据源MultiDataSource配置思路

排序三个整数

redis集群搭建【2】-Windows中Redis集群搭建

STM32F030驱动TM1650点亮4联数码管

每日归档

更多

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)