Python的文本对比模块difflib

2.1 文件内容差异对比方法

​ difflib作为Python的标准库模块,无需安装,作用是对比文本之间的差异,且支持输出可读性较强的html文档,与Linux下的diff命令相似。我们可以使用difflb对比代码、配置文件的差别,在版本控制方面是非常有用。

2.1.1 两个字符串的差异对比

#!/usr/bin/python

import difflib
# 定义字符串
text1 = '''text1: 
This module provides .... add string'''
# 以行进行分割,方便进行对比
text1_lines = text1.splitlines()
text2 = '''text2:
This module provides .... difflib document v7.6'''
text2_lines = text2.splitlines()
# 创建Differ对象
d = difflib.Differ()
# 采用compare方法对字符串进行比较
print '\n'.join(list(diff))


符号含义说明

“-” 包含在第一个序列行中,但不包含在第二个序列行中

“+” 包含在第二个序列行中,但不包含在第一个序列行中

" " 两个序列行一致

“?” 标志两个序列行存在增量差异

“^” 标志出两个序列行存在的差异字符

2.1.2 生成美观的对比HTML格式文档

d = difflib.HtmlDiff()
print(d.make_file(text1_lines,text2_lines))

再使用

python demo.py > diff.html

来生成html文件,然后使用浏览器打开diff.html查看对比,增强了可读性。

2.1.3 对比Nginx配置文件差异

​ 当我们维护多个Nginx配置时,市场会对比不同版本配置文件的差异,使运维人员更加清洗地了解不同版本迭代后的更新项,实现的思路是读取两个需对比的配置文件,再以换行符作为分隔符,调用difflib.HtmlDiff()生成HTML格式的差异文档。实现代码如下:

import difflib
import sys

try:
    # 第一个配置文件路径参数
    textfile1=sys.argv[1]
    # 第二个配置文件路径参数
    textfile2=sys.argv[2]

except Exception as e:
    print("Error:"+str(e))
    print("Useage:simple3.py filename1 filename2")
    sys.exit()

# 文件读取分隔函数
def readfile(filename):
    try:
        fileHandle = open(filename,'rb')
        text=fileHandle.read().splitlines()
        fileHandle.close()
        return text
    except IOError as e:
        print('Read file Error:'+str(e))
        sys.exit()
if textfile1=="" or textfile2=="":
    print("Usage:simple3.py filename1 filenam2")
    sys.exit()


# 调用readfile函数,获取分隔后的字符串
text1_lines = readfile(textfile1)
text2_lines = readfile(textfile2)

# 创建HtmlDiff对象
d = difflib.HtmlDiff()
# 通过make_file方法输出html格式的的比对结果
print(d.make_file(text1_lines,text1_lines))

发布了104 篇原创文章 · 获赞 33 · 访问量 3万+

猜你喜欢

转载自blog.csdn.net/WangTaoTao_/article/details/105443130