这篇文章是在我的上一篇文章上改进的,文章地址:
通过requests、BeautifulSoup下载四虎网站上的所有美女图片
上一篇文章我们获取链接的地址方式是通过在主索引页面的源码中找到各个图片的地址,但我们发现图片的地址是有规律的,首先是图片首页的地址是"https://www.1102d.com/Html/63/index.html",其他的地址都是"https://www.1102d.com/Html/63/index-%d.html"%i,i为2-181,这样我们可以将所有的地址存在一个列表里,通过遍历列表来获取地址。具体方式如下:
list=[]
url1=r"https://www.1102d.com/Html/63/index.html"
list.append(url1)
for i in range(2,182):
url=r"https://www.1102d.com/Html/63/index-%d.html"%i
list.append(url)
for i in list[::-1]:
frist(i)
代码已经上传到GitHub上,传送门