那些有用的正则表达式 - 代码天地

那些有用的正则表达式

其他 2018-05-21 18:21:12 阅读次数: 2

1. HTML 标签匹

HTML不是有特别严格编程要求的，因此在匹配时会遇到很多特殊情况需要特殊处理，这里仅仅给出一般化的解决方法：
【文本】ddd< input name=dir value=”>”>ddd
【解析】显然，文本中非转义字符>与闭尖括号的提取是难点，不能向往常一样[^>]来提取。
【表达式】 <(“[^”]*”|’[^’]*’|[^’”>])*>
“[^”]*”表示提取双括号的内容
‘[^’]*’表示提取单括号的内容
[^’”>] 表示提取其他内容
【注意】也许你用<.*>也能匹配上述文本，但是实际情况时当你遇到的是ddd< input name=dir value=”>”>ddd< / input>时候，它将匹配全部。

2. 匹配Link
【文本】< a href=”http://www.csdn.net”>my blog < / a >
【解析】要获取双引号或单引号中间的地址，但不是所有双引号的内容都是Link，“href=”很重要
【表达式】href\s*=\s*(“[^”]*”|”[^’]*”|[^”’>]+)

三、真实世界中提取URL
【文本】read the comments at http://www.baidu.com/ask_tik/index.html you can find …
【解析】URL类型包括：māilto, http, https, ftp
但是有时候文本中并不包含上诉开头，而是直接以www.baidu.com出现。
【表达式1】
(ftp|https?)://[-\w]+(.\w[-\w]*)+|
(?:[a-z0-9]( ? :[-a-z0-9][a-z0-9])?\.)+
(?:com\b
|edu\b
|gov\b
|org\b
|net\b
|[a-z][a-z]\b)
(
/
[^.!,?:”’<>()[]{}\s\x7F-\xFF]*
(?:[.!,?]+[^.!.?;”’<>()[]{}\s\x7F-\xFF])*
)?
【不包含特殊符号（?!=）的URL的表达式】https?://\w+(.\w+)+(\/\w+)*(.\w+)*
【包含特殊符号（?!=）的URL简化表达式】
https?://\w+(.\w*)+(?:\.com)*
(\/[^”’<>()[]{}\s\x7F-\xFF]*)*

猜你喜欢

转载自my.oschina.net/wellsoschina/blog/1816222

那些有用的正则表达式

有用的正则表达式(一)

收集一些复杂有用的正则表达式

04一些有用的C#正则表达式

编程时候非常有用的正则表达式记录

20个你应该掌握的强大而有用的正则表达式

关于ultraedit的使用，利用正则表达式过滤有用信息到新的文件中

正则表达式^和$有什么用？

关于正则表达式的那些个爱恨情仇

python与正则表达式的那些事

QTP的那些事--WebList与正则表达式

关于JavaScript里正则表达式的那些事儿

那些年使用过的正则表达式

Perl正则表达式(3) - 用正则表达式处理文本

正则表达式在线测试网站带有常用正则表达式

《正则表达式》正则表达式

正则表达式

正则表达式?is

正则表达式[^?&=]

正则表达式：

【正则表达式】

正则表达式|

正则表达式 - (?!), (?:), (?=)

正则表达式(.*?)

正则表达式（.*?）或（.*+）

正则表达式~

《正则表达式》

正则表达式^

(.*?)正则表达式

用正则表达式修改html字符串的所有div的style样式

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)