正则表达式基本规则
1:正则表达式在实际中的一个经典应用是识别邮箱地址。虽然不同邮箱服务器的邮箱地址的具体规则不尽相同,但是我们还是可以创建几条通用规则。
把上面的规则连接起来,就获得了完整的正则表达式。
[A-Za-z0-9\._+]+@[A-Za-z]+\.(com|org|edu|net)
2:正则表达式常用符号
3:简单示例
a:注意代码中的正则表达式
# coding=utf-8
"""
@author: jiajiknag
程序功能:获取网页上的图片,且打印出图片的相对路径
待抓取的网页是 http://www.pythonscraping.com/pages/page3.html
"""
from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
# urlopen 用来打开并读取一个从网络获取的远程对象
html = urlopen("http://www.pythonscraping.com/pages/page3.html")
bs0j = BeautifulSoup(html)
images = bs0j.findAll("img",{"src":re.compile("\.\./img\/gifts/img.*\.jpg")})
for image in images:
print(image["src"])
b:结果
4:在线正则表达式
在线检查自己写的正则表达式是否正确:https://www.regexpal.com/
注:
不全面,如有关于正则表达式的会继续更新,博主只是用来作为自己的电子笔记以后方便查阅罢了!!!