bs4爬取网站图片

版权声明:未经王小波同学允许不得转载本文内容,否则将视为侵权;博主qq:1419758909;反正也没人转载~ https://blog.csdn.net/qq_38900441/article/details/86686763
import requests
import bs4
#请求的路径
baseUrl='http://imgur.com'
#在本地创建一个目录 =文件名
# dirName='image'
#创建
# os.makedirs(dirName,exist_ok=True)
#完整的请求地址
url=baseUrl+"/search/score?q="+"movie"
#请求这个网页
response=requests.get(url)
#检查这个网页是否请求成功了
response.raise_for_status()
# print('打印的text;'+response.text+':结束的地方')
#BeautifulSoup   1、遍历文档树    2、搜索文档树
soup=bs4.BeautifulSoup(response.text,"html.parser")
# print(soup)
#已经获取到image图片标签了
imageURLS=soup.select(".image-list-link img")
# print(imageURLS)
num=1
if not imageURLS:
    print("没有找到图片!")
else:
    for imageURL in imageURLS:

        #获取图片路径的节点
        downloadUrl=imageURL.get('src')
        # print(downloadUrl)
        imageStream = requests.get("http:" + downloadUrl)
        # print(imageStream.content)
        num += 1  # 循环一次加一
        yuan = imageStream.content  # 得到你图片的内容
        # print(yuan)
         #写进本地
        with open('E:\\out\\' + str(num) + '.jpg', 'wb') as f:
            print("正在写入第%d张" % num)
            f.write(yuan)  # 写进去
            f.close()  # 关闭文件

猜你喜欢

转载自blog.csdn.net/qq_38900441/article/details/86686763