Python3 破解煎蛋网妹子图的加密函数，获取图片 - 代码天地

Python3 破解煎蛋网妹子图的加密函数，获取图片

其他 2018-10-08 12:18:17 阅读次数: 0

今天闲来无事，抓取煎蛋网上的妹子图，之前就知道源代码中找不到img的真实地址，被换成了jandan_load_img(this)这个函数，这个函数定义很复杂，而我又不懂JS，没办法，只有硬着头皮上。

在网上找了各种办法，大概花了3个多小时，还是一无所获，正准备放弃时，看到代码中有调用这个函数:

function base64_encode(a) {
return window.btoa(a)
};

这是干嘛的呢？百度得知是base64转ascii码，闲来无事将

<span class="img-hash">Ly93eDEuc2luYWltZy5jbi9tdzYwMC8wMDZyRkhuQWx5MWZ2c2xvdjVnbnFqMzBnczBkdTc1eS5qcGc=</span>

标签中的Text转试试，得到了如下结果

//wx1.sinaimg.cn/mw600/006rFHnAly1fvslov5gnqj30gs0du75y.jpg

之前也有爬取过煎蛋网上的妹子图，一眼看出这就是图片的原地址啊，绕来绕去原来这么简单！！！！！

赶紧写下代码验证，果然都可以正确获取。

代码如下：

#coding=utf-8
import base64
import requests
from bs4 import BeautifulSoup

 

def getHtml(url):
    try:
        headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:56.0) Gecko/20100101 Firefox/56.0'}  
        response = requests.get(url,headers = headers)
        if response.status_code == 200:
            return response.text
        return None
    except RequestException:
        return None
 
def getimgurl(html,imglist):
    soup = BeautifulSoup(html, 'lxml')
    imgs = soup.select('.img-hash')
    for img in imgs:
        imgurl =  base64.b64decode(img.text).decode()
        imgurl = 'http://' + imgurl
        imglist.append(imgurl)
    
        
            
if __name__=='__main__':
    imglist = []
    for i in range(1,2):
        url  = ("http://jandan.net/ooxx/page-%s#comments" % str(i))
        html = getHtml(url)
        getimgurl(html,imglist)
    for img in imglist:
        print (img)

就这么简单！

猜你喜欢

转载自blog.csdn.net/qq523176585/article/details/82919565

Python3 破解煎蛋网妹子图的加密函数，获取图片

python爬取煎蛋网妹子图，已解密图片~~~~~

Python Scrapy 煎蛋网妹子图实例

python3通过selenium对煎蛋网妹子图的简单爬取

python3爬虫爬取煎蛋网妹纸图片

python爬虫.4.下载煎蛋网妹子图

python爬虫煎蛋网妹子图动态爬虫1

python爬虫煎蛋网妹子图2（代码）

python 爬虫爬取煎蛋网妹子图

Python3 Scrapy框架学习三：爬取煎蛋网加密妹子图片(全爬)

python3 爬煎蛋ooxx妹子图

妹子图煎蛋网居然还要加密方式？看我大Python暴力破解！P

python3爬虫爬取煎蛋网妹纸图片（下篇）2018.6.25有效

Python的学习笔记DAY8---爬虫练习之煎蛋网妹子图爬虫

Python3 函数

python3的函数

Python3函数

[Python3]函数

Python3——函数

python3 | 函数

Python3多线程爬取妹子图的图片

Python3 爬虫实例妹子图

python爬虫入门-煎蛋网妹子图片下载 python爬虫之反爬虫情况下的煎蛋网图片爬取初步探索

Python：python3函数

python3 hash加密

python3，切图片

Python3 html获取

python3 获取cookie

Python3快速入门（五）——Python3函数

python3之函数

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)