正则表达式实现添加、删除、替换功能

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_32113189/article/details/80969179

最近呢,公司让写一个组件,要求用正则表达式构建一个中文的匹配组件,许多问题就来了,大多是用自动机来构建一个正则表达式的引擎,小编虽然大学的时候学过编译原理,可奈何现在已经忘得差不多了,只能通过现有的正则表达式来进行功能实现。

下面的代码呢实现了通过用正则表达式来对某一个句子的添加、替换、删除三种操作,不知道这个适不适合大家的口味,反正小编已经做好让公司头批评的准备了,因此小编是在是现学不来呀。

# -*- conding:utf-8 -*-

import re

txt = '这个池子的体积大约是34立方米容积'

'''role为匹配规则,re_out为替换部分格式为“\1(替换部分)”'''
def Replace(role,re_out):
    out = re.compile(role)
    String_out = out.sub(re_out,txt)
    print(String_out)
Replace(r'(这个池子的体积大约是34)(.*)',r'\1平方米')
'''
role为匹配规则,num为将要删除的元素(从1开始)
'''
def Delete(role,num):
    out = re.search(role,txt).group(num)
    string = txt.split(out)
    String_out = ''.join(string)
    print(String_out)
Delete('(这个池子的体积大约是34)(.*)(容积)',2)

def Add(role,re_out):
    out = re.compile(role)
    String_out = out.sub(re_out,txt)
    print(String_out)
Add(r'(这个池子的体积大约是34)(.{0})',r'\1的')

下面的图片是小编运行这三个函数得到的结果,大家可以看看,如果有需要的可以参考一下,另外,小编需要人告诉我这个正则表达式如何用自动机来实现,他的原理是什么,欢迎大家的留言哦。
这里写图片描述

猜你喜欢

转载自blog.csdn.net/qq_32113189/article/details/80969179