python爬虫学习（九）妹子图分页爬取 - 代码天地

python爬虫学习（九）妹子图分页爬取

其他 2020-03-26 15:03:32 阅读次数: 0

就是把url换成了通配符
比较简单

# -*- coding: utf-8 -*-
import requests
import re
import os
if __name__ == '__main__':
    #创建一个文件夹，保存所有图片
    if not os.path.exists('./MMLibs'):
        os.mkdir('./MMLibs')

    headers = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'
    }
    #设置通用url通用模板
    url='https://www.2717.com/tag/434_%d.html'
    #pageNum=2
    for pageNum in range(0,6):
        #对应页码的url
        new_url= format (url % pageNum)
        #使用通用爬虫对url对应的页面整张爬取
        page_text = requests.get(url=new_url,headers=headers).text
        #使用聚焦爬虫进行解析
        ex = '<li>.*?<img.*?src="(.*?)".*?</li>'
        img_src_list= re.findall(ex,page_text,re.S)
        #print(img_src_list)
        for src in img_src_list:
            img_data = requests.get(url=src,headers=headers).content
            #生成图片名称
            img_name= src.split('/')[-1]
            #图片储存路径
            imgPath = './MMLibs/'+img_name
            with open(imgPath,'wb')as fp:
                fp.write(img_data)
                print("第%d页" %pageNum,img_name,"下载成功")

发布了23 篇原创文章 · 获赞 0 · 访问量 672

私信关注

猜你喜欢

转载自blog.csdn.net/haimian_baba/article/details/103746758

python爬虫学习（九）妹子图分页爬取

[python爬虫]爬取妹子图

Python爬虫教程：爬取妹子图

python爬虫——爬取妹子图

python 爬虫爬取煎蛋网妹子图

Python 爬虫入门(二)——爬取妹子图

[python爬虫] 使用多进程爬取妹子图

Python爬虫——利用requests模块爬取妹子图

Python 爬虫入门之爬取妹子图

多线程爬取妹子图 python 爬虫

Python爬虫入门教程：爬取妹子图网站

Python爬虫入门【2】：妹子图网站爬取

Python之Scrapy爬虫实战--爬取妹子图

Python 爬虫（清纯）妹子图爬取（代码自由奔放）

python爬虫30秒爬取1000张妹子图

【Python爬虫】使用代理爬取妹子图

python爬取妹子图

python爬虫-爬妹子图

爬虫爬取清纯妹子图

爬虫--多进程爬取妹子图

爬虫--lxml爬取妹子图

python爬虫学习（十三）xpath爬取妹子图片

python爬虫学习（七）爬取单张妹子图片

Python爬虫之——爬取妹子图片

python 爬取煎蛋ooxx妹子图

Python爬取煎蛋妹子图

Python 爬取煎蛋妹子图

福利！！！Python爬取好看的妹子图！！！

Python福利——爬取妹子图

【福利篇】python爬取妹子图

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)