python爬虫煎蛋网妹子图2（代码） - 代码天地

python爬虫煎蛋网妹子图2（代码）

编程语言 2018-06-05 11:30:30 阅读次数: 3

——————来自某潮汕人的菜鸟教程

import requests
import re
import base64

def base64_decode1(s):
    s = s.encode()
    missing_padding = len(s) % 4
    if missing_padding != 0:
        s += b'=' * (4 - missing_padding)
    return base64.decodestring(s)

def get_info(url):
    '''返回下一页网页的URL和当前网页每个图片的img_hash
        当flag=0时还有下一页，1时没有下一页
    '''
    next_pages_url=''
    result=requests.get(url=url).text

    flag=0
    try:
        next_pages_url=re.findall('<a title="Older Comments" href="(.*?)"',result,re.DOTALL)[0]
    except:
        print('超过源网站的下载页数')
        flag=1
    img_hash=re.findall('<span class="img-hash">(.*?)</span></p>',result,re.DOTALL)
    print(next_pages_url)
    print(img_hash)
    return 'http:'+next_pages_url,img_hash,flag

if __name__=='__main__':
    image_list=[]#储存图片URL的列表
    max_pages = 10
    start_url='http://jandan.net/ooxx'
    next_pages_url=start_url
    file_path='E:\\'
    for _ in range(max_pages):
        '''得到所有的图片的url,并添加进image_list'''
        next_pages_url,img_hash,flag=get_info(next_pages_url)
        for hash in img_hash:
            image_list.append(base64_decode1(hash))
        if flag == 1:
            break#没有下一页



    sum_image=len(image_list)
    print('总共有'+str(sum_image)+'张图片')

    index=0
    for image in image_list:
        '''下载图片'''
        try:
            image_url = 'http:'+image.decode()
        except:
            print('错误链接')
            continue
        filename = image_url.split('/')[-1]

        r = requests.get(image_url)
        with open(file_path+filename, 'wb') as f:
            f.write(r.content)
        index+=1
        print('\r下载进度'+str(int(index*100/sum_image))+'%',end='')

猜你喜欢

转载自blog.csdn.net/m0_37959925/article/details/80563817

python爬虫煎蛋网妹子图2（代码）

python爬虫煎蛋网妹子图动态爬虫1

Python Scrapy 煎蛋网妹子图实例

python爬虫.4.下载煎蛋网妹子图

python 爬虫爬取煎蛋网妹子图

爬虫之煎蛋网妹子图大爬哦

python爬取煎蛋网妹子图，已解密图片~~~~~

Python的学习笔记DAY8---爬虫练习之煎蛋网妹子图爬虫

python3通过selenium对煎蛋网妹子图的简单爬取

Python3 破解煎蛋网妹子图的加密函数，获取图片

Python爬虫(6):煎蛋网全站妹子图爬虫

Python爬虫煎蛋网全站妹子图爬虫

python爬虫入门-煎蛋网妹子图片下载 python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索

爬取煎蛋网妹子图

煎蛋网妹子图爬取

python 爬取煎蛋ooxx妹子图

Python爬取煎蛋妹子图

Python 爬取煎蛋妹子图

[Python 爬虫]煎蛋网 OOXX 妹子图爬虫（1）——解密图片地址

python3爬虫爬取煎蛋网妹纸图片

Python爬虫入门教程，突破煎蛋网反爬措施，妹子图批量抓取！

用Selenium+PhantomJS来抓取煎蛋网妹子图

python3 爬煎蛋ooxx妹子图

python爬虫-爬妹子图

Python 爬虫（清纯）妹子图爬取（代码自由奔放）

Python爬虫入门【2】：妹子图网站爬取

python3爬虫爬取煎蛋网妹纸图片（下篇）2018.6.25有效

Python教程：老师傅带你爬取全网妹子图！

简单应用Selenium+PhantomJS来抓取煎蛋网妹子图

[python爬虫]爬取妹子图

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)