python的re模块正则使用方式

    img_url=[]
    img_urls=soup.find('div',attrs={'class':'zgn2R'}).find('div',attrs={'class':'VSCT'}).find('script',attrs={'type':'text/javascript'})
    img_urls=str(img_urls)
    # print(img_urls)
    regex=re.search("//[^\s]*,",img_urls)
    tupian_url=regex.group(0)
    tupian_url=tupian_url.replace('",','')
    img_url.append('http:'+tupian_url)
    # print(img_url)

group(0)表示匹配整体,group(1)表示匹配第一个()内的内容

发布了147 篇原创文章 · 获赞 9 · 访问量 4万+

猜你喜欢

转载自blog.csdn.net/weixin_44049466/article/details/104698294