使用Python3+requests库爬取海量精美图片(改良版) - 代码天地

使用Python3+requests库爬取海量精美图片(改良版)

编程语言 2019-04-20 17:10:50 阅读次数: 0

安装requests库

打开cmd，输入命令：pip install requests

import re,os,time
import requests

os.mkdir('mm')
os.chdir('mm')

#请求头
head={}
head['User-Agent']='Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36'

#设置网站起始页码
cou=2350
while True:
    strcou=str(cou)
    cou=cou+1
    #网站首页地址
    url2='http://jandan.net/ooxx/page-'+strcou+'#comments'
    a=requests.post(url2,data=None,headers=head)
    res=a.content.decode('utf-8')
    #正则表达式匹配网址
    a=re.findall(r'//wx+.+?.jpg',res)
    #去掉列表中重复的网站点
    ll=list(set(a))
    #计算列表中有多少个网站
    b=len(ll)
    c=b-1
    while True:
        #这个是图片地址
        url='http:'+a[c]
        resp=requests.post(url,data=None,headers=head)
        res=resp.content
        #保存图片
        with open(str(int(time.time()))+'.jpg','wb') as f:
            f.write(res)
        c-=1
        if c==0:
            break

猜你喜欢

转载自blog.csdn.net/xiaojiawen/article/details/89420041

使用Python3+requests库爬取海量精美图片(改良版)

Python3+urllib爬取海量精美图片

爬虫Spider 常用正则表达式爬取网页信息及分析HTML标签总结 Selenium定向爬取虎扑篮球海量精美图片

python爬取优美图库海量图片，附加代码，一键爬取

16-python爬虫之Requests库爬取海量图片

Python爬虫之Requests库爬取海量图片！数据都是钱啊

python登录注册改良版

用bootstrap做的一个透明精美图片轮播的登录页面

Midjourney 玩上瘾了，免费AI 绘图指令一键产生精美图片

python3+requests：使用类封装接口测试脚本

使用requests 库爬取百度图片

【精选优质人物美图 InsCode Stable Diffusion 美图活动一期】自测使用Inscode-AI绘图模型生成精美图片详细教程（无需任何配置，小白也能立马运行）

python3爬虫系列之使用requests爬取LOL英雄图片

冒泡排序的改良版

Python网络编程改良版服务端

Python网络编程改良版客户端

Python使用urllib,urllib3,requests库+beautifulsoup爬取网页

Python3.x使用requests库将爬取数据存储到MySQL

python3+requests：get/post请求

python3+requests get/post 请求

Python爬虫使用requests库爬取表情包

python3爬虫-使用requests爬取起点小说

Python爬取数据之Requests库!

Requests爬取chinadaily海量新闻数据

自己动手用Python3+Requests库写百度翻译API

python3+requests库框架设计05-unittest单元测试框架

python3+requests库框架设计07-发送邮件

python3+requests库框架设计06-HTMLTestRunner

python3+requests库框架设计04-配置文件

python3+requests库框架设计03-请求重新封装

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)