python 字符串相似度判断详解 - 代码天地

python 字符串相似度判断详解

其他 2021-03-20 07:34:45 阅读次数: 0

1. 背景介绍

最近项目中要用到两个字符串相似度的求解算法，来矫正ocr文本识别的结果，进而提高识别的准确率，通过矫正（相当于模糊查询），识别准确率从65%上升到90%。其结果还是令人兴奋的，因此写博客以记录。

2. 方法与实现

本文实现的方法是：“编辑距离”，所谓编辑距离，就是用来计算从原串（s）转换到目标串(t)所需要的最少的插入，删除和替换的数目。

最后：先取两个字符串长度的最大值maxLen，用1-（需要操作数除maxLen），得到相似度。

例如，abc 和abe 需要一个操作，长度为3，所以相似度为1-1/3=0.666。

必要的安装包：pip install python-Levenshtein 指令安装 Levenshtein

import Levenshtein

str_list = ["你好", "今天天气很好", "明天去吃大餐", "我喜欢编程"]
string = "天气正好好"

score_list = []

for i in str_list:
    # 计算编辑距离相似度，即莱文斯坦比
    score = Levenshtein.ratio(string, i)
    score_list.append(score)

print("%s与其他字符串的相似度分别为" % string)
print(str_list)
print(score_list)

输出结果：

天气正好好与其他字符串的相似度分别为
['你好', '今天天气很好', '明天去吃大餐', '我喜欢编程']
[0.2857142857142857, 0.5454545454545454, 0.18181818181818182, 0.0]

看来结果还是比较可靠的，相似度越高，说明两个字符串越接近。博主在项目中用到了该技巧，使文本识别的准确率大大提高。

参考：字符串相似性的其他几种度量方法

编辑距离的C++实现

猜你喜欢

转载自blog.csdn.net/Guo_Python/article/details/110229037

python 字符串相似度判断详解

判断字符串相似度-python

python 判断字符串相似度

python比较字符串相似度

Python中的字符串相似度

【script】python字符串相似度匹配

python 对比两个字符串相似度

判断两字符串相似度

Python字符串的判断

Python字符串详解

Python 字符串详解

Python 字符串详解

Python3 计算字符串变换相等的最小操作代价 2020远景智能计算字符串相似度

python字符串编码判断

python数字和字符串的判断

python——字符串的操作判断

Python字符串判断函数

python判断字符串相等

python基础(一)字符串判断

python判断字符串所属类型

python判断字符串包含关系

Python 字符串常用判断函数

Python判断字符串的构成

python字符串【判断】方法

C# 中如何判断字符串的相似度

字符串相似度

详解 Python 字符串（一）：字符串基础

Python字符串的常见操作字符串判断字符串分割

一文详解Python字符串条件判断方法

Python 判断图片相似度的方法

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)