python正则表达式常见面试题

s = "<div>\
<p>岗位职责:</p>\
<p>完成推荐算法、数据统计、接口、后台等服务器端相关工作</p>\
<p><br></p>\
<p>必备要求:</p>\
<p>良好的自我驱动力和职业素养,工作积极主动、结果导向</p>\
<p>&nbsp;<br></p>\
<p>技术要求:</p>\
<p>1、一年以上 Python 开发经验,掌握面向对象分析和设计,了解设计模式</p>\
<p>2、掌握HTTP协议,熟悉MVCMVVM等概念以及相关WEB开发框架</p>\
<p>3、掌握关系数据库开发设计,掌握 SQL,熟练使用 MySQL/PostgreSQL 中的一种<br></p>\
<p>4、掌握NoSQLMQ,熟练使用对应技术解决方案</p>\
<p>5、熟悉 Javascript/CSS/HTML5JQueryReactVue.js</p>\
<p>&nbsp;<br></p>\
<p>加分项:</p>\
<p>大数据,数理统计,机器学习,sklearn,高性能,大并发。</p>\
</div> "

print(re.sub(r"</?\w+>|&nbsp","",s))





import re

#提取出域名
s2 = """http://www.interoem.com/messageinfo.asp?id=35`
http://3995503.com/class/class09/news_show.asp?id=14
http://lib.wzmc.edu.cn/news/onews.asp?id=769
http://www.zy-ls.com/alfx.asp?newsid=377&id=6
http://www.fincm.com/newslist.asp?id=415"""

p = r"(http://.+?/).+"

print(re.sub(p, lambda x : x.group(1), s2))




import re

#提取出单词
s3 = "hello world ha ha"

print(re.split(r" +", s3))

print(re.findall(r"\b\w+\b", s3))

猜你喜欢

转载自blog.csdn.net/qq_35574888/article/details/80967859