notepad++ 正则表达式查找特定字符串

批量文本的处理方法

在报文中有很多指标和值都具有固定的格式,比如是  a="1" 这类格式,那么我们只取前面的指标a,就会比较复杂,而使用正则表达式就会快乐许多!

采用以下第二种方法

查找目标 =(.+?)\"    表示查找以等号开头,引号和空格  结尾的字符串,可以避免查到第一个引号,然后批量可以替换为\n,即每个指标单独进行换行罗列

1.正则表达式匹配以某字符开头的这一行数据

表达式:
(?:^|\n)字符位置.*     

示例:
(?:^|\n)prompt.*表示以prompt开头的这一行字符串。

2.正则表达式匹配以a字符串开头,b字符串结尾的字符,中间不管

表达式:
a字符串位置(.+?)b字符串位置 ,注意很多字符有特殊意义,要加上\来转义
示例:
匹配以to_date开头,以), 字符串结尾的字符串
to_date(.+?)\), 即可,注意对)进行转义。
注意:
上述说的是以(括号逗号)结尾。

3.只匹配纯数字的字符串

表达式:
^[0-9]+$
解释:
^:匹配行首
[0-9]+:匹配1个或多个数字
$:匹配行尾,总的来说就是匹配一行数字
示例:
只匹配文档中全是数字的某一行,任何符号都不能有。

4.只匹配纯字母的字符串

表达式:
^[A-Za-z]+$
解释:
^:匹配行首
[A-Za-z]+:匹配1个或多个字母
$:匹配行尾,总的来说就是匹配一行字母
示例:
只匹配文档中全是字母的某一行,任何符号都不能有。

5.同时查找多个字符串

表达式:
a|b
示例:
张三|李四|王五
解释:
同时查找文中包含张三、李四、王五字符串所在的行。

正则表达式(.+)和(.+?)的区别

1、符号释义

① () 分组符,把括号内的字符当成一个整体处理。

② . 与换行符外的字符都匹配,针对单字符。

③ + 前一字符必须存在,可以重复1次或更多次

④ ?跟在子串后,表示匹配前面的字符串1次或0次,即前一字符可以存在也可以不存在,但是存在只能有一次;

跟在.、+、?后,表示进入非贪婪模式,也称为惰性模式。

正则默认贪婪模式

    贪婪模式

尽可能匹配最长的字符串。贪婪匹配是先看整体字符串是否匹配,如果不匹配,它会去掉字符串中的最后一个字符再次尝试匹配。以此循环,直至匹配成功。

    非贪婪模式

尽可能匹配最短的字符串。惰性匹配是从左侧第一个字符向右匹配,先看是否匹配,若不匹配,就加入右侧下一个字符再次尝试匹配。以此循环,直至匹配成功。
3、实例

存在字符串"<1><123>"

①正则表达式<(.+)>表示尽可能匹配最长的符合规则<字符串>的内容,最终返回"<1><123>"

②正则表达式<(.+?)>表示尽可能匹配最短的符合规则<字符串>的内容,最终返回"<1>"
————————————————
版权声明:本文为CSDN博主「Bitup_bitwin」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_44259499/article/details/129342053

猜你喜欢

转载自blog.csdn.net/qq_41638825/article/details/131891476