import re
import urllib.request
def getHtmlContent(url):
page=urllib.request.urlopen(url)
return page.read().decode('utf-8')
def getJPGS(html):
jpgReg=re.compile('<img class="BDE_Image".*?src="(.*?\.jpg)".*?>')
jpgs=re.findall(jpgReg,html)
return jpgs
def downloadJpgs(imgurl,filename):
urllib.request.urlretrieve(imgurl,filename)
def batchDownloadJPGs(imgUrls,path='杨幂/'):
count=1
for url in imgUrls:
downloadJpgs(url,''.join([path,'{0}.jpg']).format((count)))
print('下载完成第{}张图片'.format(count))
count=count+1
def download(url):
html=getHtmlContent(url)
jpgs=getJPGS(html)
batchDownloadJPGs(jpgs)
def main():
url='http://tieba.baidu.com/p/5814412543'
download(url)
if __name__=='__main__':
main()
下载完成第1张图片
下载完成第2张图片
下载完成第3张图片
下载完成第4张图片
下载完成第5张图片
下载完成第6张图片
下载完成第7张图片
下载完成第8张图片
下载完成第9张图片
下载完成第10张图片
下载完成第11张图片
下载完成第12张图片
下载完成第13张图片