python爬虫，一段完整的python爬虫批量下载网站图片资源的代码 - 代码天地

python爬虫，一段完整的python爬虫批量下载网站图片资源的代码

其他 2020-01-29 15:50:51 阅读次数: 0

# 本程序为爬虫学习代码，成功爬取了漫微网站上的全部图片内容
import re
import os
import requests

def getHTMLText(url):
    try:
        r=requests.get(url)
        r.raise_for_status()
        r.encoding=r.apparent_encoding
        return r.text
    except:
        print("request failed")

url = 'http://marvel.mtime.com/' # 漫微网址
web_data = getHTMLText(url)  # web_data保存目标url的html代码内容
res = re.compile(r'src="(.+?.jpg)"') # 定义查询规则，所有以src开头，中间包含任意多个字符的，并且结尾为.jpg的文件被
                                    #提取并保存
reg = re.findall(res, web_data) # 在web_data中找到并提取满足res规则的全部字符串，并保存在reg列表
for i in reg:
    target_url = url + i      # 变量target_url获得图片的url
    try:
        pic = requests.get(target_url).content # 从target_url下载了图片，并以二进制的形式保存在变量pic中
    except:
        print(target_url + 'can not open')
    res = re.compile(r'images/(.+?.jpg)')
    pic_name = re.findall(res, i)[0]  #提取图片文件名，从结果数组第[0]个元素获得具体文件名
    print(pic_name)
    with open(pic_name, 'wb') as f:
        f.write(pic)

猜你喜欢

转载自www.cnblogs.com/iceberg710815/p/12240408.html

python爬虫，一段完整的python爬虫批量下载网站图片资源的代码

一段完整的批量下载网站视频资源的python爬虫代码（附注解）

一段Python爬虫代码的分析

Python爬虫实战：批量下载网站图片

python 爬虫批量下载图片

记录一次python爬虫批量下载一个校花网站的妹子图片

Python爬虫项目实战：看我用爬虫批量下载网站图片

python实现爬虫批量下载图片

python图片爬虫 - 实现unsplash批量下载

python爬虫下载图片--艺术网站

写一段爬虫程序，用python

python爬虫完整代码

Python爬虫实战（六）——使用代理IP批量下载高清小姐姐图片（附上完整源码）

Python爬虫框架 scrapy 入门经典project 爬取校花网资源、批量下载图片

写一段python代码爬壁纸网站

利用Python爬虫实现网页图片批量下载

python爬虫实例之百度图片的批量下载

python多线程爬虫+批量下载斗图啦图片

Python爬虫的小白学习笔记1-批量下载图片

python爬虫——批量下载百度图片

Python爬虫实战批量下载高清美女图片

Python爬虫完整代码模版

Python爬虫实战（五）：根据关键字爬取某度图片批量下载到本地（附上完整源码）

Python爬虫实战（七）——使用代理IP批量下载4K高清小姐姐图片（附上完整源码）

python 爬虫试了五种爬喜马的方法并做了测试代码(爬虫系列研究告一段落了...)

Python爬虫系列（二）——Python爬虫批量下载百度图片

Python批量爬虫下载PDF文件代码实现

Python实操网站图片爬虫自动下载

java编写的一段简单的爬虫demo代码

关于详解一段爬虫代码（原创，启发自一段与师兄的对话）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)