bs4爬取网站图片 - 代码天地

bs4爬取网站图片

编程语言 2019-01-29 10:50:50 阅读次数: 0

版权声明：未经王小波同学允许不得转载本文内容，否则将视为侵权；博主qq:1419758909;反正也没人转载~ https://blog.csdn.net/qq_38900441/article/details/86686763

import requests
import bs4
#请求的路径
baseUrl='http://imgur.com'
#在本地创建一个目录 =文件名
# dirName='image'
#创建
# os.makedirs(dirName,exist_ok=True)
#完整的请求地址
url=baseUrl+"/search/score?q="+"movie"
#请求这个网页
response=requests.get(url)
#检查这个网页是否请求成功了
response.raise_for_status()
# print('打印的text;'+response.text+'：结束的地方')
#BeautifulSoup   1、遍历文档树    2、搜索文档树
soup=bs4.BeautifulSoup(response.text,"html.parser")
# print(soup)
#已经获取到image图片标签了
imageURLS=soup.select(".image-list-link img")
# print(imageURLS)
num=1
if not imageURLS:
    print("没有找到图片！")
else:
    for imageURL in imageURLS:

        #获取图片路径的节点
        downloadUrl=imageURL.get('src')
        # print(downloadUrl)
        imageStream = requests.get("http:" + downloadUrl)
        # print(imageStream.content)
        num += 1  # 循环一次加一
        yuan = imageStream.content  # 得到你图片的内容
        # print(yuan)
         #写进本地
        with open('E:\\out\\' + str(num) + '.jpg', 'wb') as f:
            print("正在写入第%d张" % num)
            f.write(yuan)  # 写进去
            f.close()  # 关闭文件

猜你喜欢

转载自blog.csdn.net/qq_38900441/article/details/86686763

bs4爬取网站图片

python利用 request bs4 模块爬取imgur网站图片

爬虫--爬取网页图片--bs4

bs4爬取网页基础

BS4爬取小说内容

爬虫之爬取图片（运用了bs4和正则查取）

python接口自动化测试十八：使用bs4框架爬取图片

Python网络爬虫requests、bs4爬取空姐图片，福利哦

Python网络爬虫requests、bs4爬取空姐网图片

用bs4和urllib 爬取视频

bs4 爬取网页数据(一)

bs4爬取漫画并写入TXT文档

python使用bs4爬取boss静态页面

Python使用bs4爬取 cnblogs

bs4解析爬取星巴克数据

bs4库爬取天气预报

使用bs4实现将诗词名句网站中三国演义小说章节内容爬取

python超详细零基础 bs4解析之爬取唯美图片

网络爬虫 - 4 bs4的使用方法与爬取案例

利用bs4和requests爬取股票历史交易数据

Python3-selenium\phantomjs\bs4爬取斗鱼页面

爬虫入门之爬取策略 XPath与bs4实现(五)

python2使用bs4爬取腾讯社招

使用requests和bs4模块爬取虎扑爆照区照片

用xpath、bs4、re爬取B站python数据

利用python bs4爬取个人逾期数据

利用python bs4爬取企业逾期数据

[Python 爬虫之路1] 爬取糗事百科（requests，bs4）

python爬虫系列(3.7-使用 bs4 爬取获取贵州农产品)

使用BS4爬取个人博客内容以及整理个人博客

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

循环神经网络（rnn）讲解

Tigao教程四：单独的关节运动

金蝶K3WISE15.0-注册套打教程

如何在Mac上配置Kubernetes

Android应用结束自身进程的方法

SpringMVC学习十三拦截器栈

中国驻洛杉矶总领馆举行新春招待会

HttpClient get post 发送

11 - three.js 笔记 - 绘制三维字体模型

Mysql递归获取某个父节点下面的所有子节点和子节点上的所有父节点

每日归档

更多

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)