爬虫_百度贴吧图片

# https://tieba.baidu.com/p/5815297430
import re
import urllib.request

#1.发送请求,获取html
def getHtmlContent(url):
    page=urllib.request.urlopen(url)
    return page.read().decode('utf-8')
#2.从html中解析出图片url
def getJPGS(html):
    #创建正则
    jpgReg=re.compile('<img class="BDE_Image".*?src="(.*?\.jpg)".*?>')
    jpgs=re.findall(jpgReg,html)
    return jpgs

#3.用图片url保存成文件名
def downloadJpgs(imgurl,filename):
    urllib.request.urlretrieve(imgurl,filename)

#4.批量下载图片,保存在当前目录文件夹下
def batchDownloadJPGs(imgUrls,path='杨幂/'):
    # 用于给图片命名
    count=1
    for url in imgUrls:
        downloadJpgs(url,''.join([path,'{0}.jpg']).format((count)))
        print('下载完成第{}张图片'.format(count))
        count=count+1

#5.函数回调
def download(url):
    html=getHtmlContent(url)
    jpgs=getJPGS(html)
    batchDownloadJPGs(jpgs)

#定义主函数
def main():
    # url='https://tieba.baidu.com/p/5815297430'
    url='http://tieba.baidu.com/p/5814412543'
    download(url)

if __name__=='__main__':
    main()
下载完成第1张图片
下载完成第2张图片
下载完成第3张图片
下载完成第4张图片
下载完成第5张图片
下载完成第6张图片
下载完成第7张图片
下载完成第8张图片
下载完成第9张图片
下载完成第10张图片
下载完成第11张图片
下载完成第12张图片
下载完成第13张图片

发布了76 篇原创文章 · 获赞 23 · 访问量 1万+

猜你喜欢

转载自blog.csdn.net/qq_39309652/article/details/104366576