爬取性感小姐姐 - 代码天地

爬取性感小姐姐

其他 2019-10-23 16:01:28 阅读次数: 0

网站地址：http://www.meizitu.com/a/more_1.html


from bs4 import BeautifulSoup
import random,os,requests
 
headers = {
    'User-Agent': "Mozilla/5.0 (Macintosh; Intel Mac OS X 10.13; rv:58.0) Gecko/20100101",
    'Referer': "http://i.meizitu.net"
}
 
def home_page(num,num2,headers):
    list_url = []
    for num in range(num,num2+1):
        url = "http://www.meizitu.com/a/more_%d.html"%num
        req = requests.get(url,headers=headers)
        req.encoding = req.apparent_encoding
        html = req.text
        bf = BeautifulSoup(html,'lxml')
        targets_url = bf.find_all(class_="pic")
        for each in targets_url:
            list_url.append(each.a.get('href'))
    return list_url
 
 
def deal_page(headers,list_url):
    list_url2 = []
    for targets_url2 in list_url:
        req = requests.get(targets_url2,headers=headers)
        req.encoding = "utf-8"
        html2 = req.text
        bf2 =  BeautifulSoup(html2,'lxml')
        targets_url3 = bf2.find_all(id="picture")
        # print(targets_url3)
        list_url2.append(targets_url3)
    return list_url2
 
def download(headers,list_url2):
    list_url3 = []
    # ================================
    print(list_url2)
    import re
    urls = re.findall(r'http.*?jpg',str(list_url2))
    print(urls,len(urls))
    for endurl in urls:
        filename = (endurl.split('/')[-3]) + (endurl.split('/')[-2]) +(endurl.split('/')[-1])
        print(endurl)
        print(filename)
        req3 = requests.get(endurl, headers=headers)
        root = "//Users//apple//Desktop//meizitu//"
        path = root + str(random.randrange(10000)) + filename
        if not os.path.exists(path):
            with open(path, 'wb') as f:
                f.write(req3.content)
            f.close()
            print("下载完成")
 
if __name__ == '__main__':
    num = int(input("请输入要爬取的起始页："))
    num2 = int(input("请输入终止页："))
    a = home_page(num,num2,headers)
    b = deal_page(headers, a)
    download(headers, b)

猜你喜欢

转载自www.cnblogs.com/Chen-MJ/p/11726674.html

爬取性感小姐姐

简单的爬虫爬取小姐姐

python爬取网页小姐姐

简单爬取小姐姐的照片

js混淆爬取小姐姐壁纸

java爬虫WebMagic框架爬取小姐姐的图片

爬取某直播网站首页小姐姐的照骗

python爬取各大网站的小姐姐

python爬虫-爬取你想要的小姐姐

python3 爬取小姐姐图片

爬取某婚恋网站数千小姐姐头像

让小姐姐在命令行里面性感跳舞

又写了个爬取小姐姐图片的爬虫，（比上次写的稍微复杂了点）

Requests库入门——应用实例-网络图片的爬取与保存（好看的小姐姐≧▽≦）

Python爬虫之如何爬取抖音小姐姐的视频

【python】爬虫爬取美丽小姐姐图片美女壁纸

python爬虫(八、爬取图片社的小姐姐图片并下载)

Python爬虫实战：爬取小姐姐最近的听歌曲目

手把手教你爬取小姐姐视频

一个简单的实例操作入门python爬虫--爬取漂亮小姐姐的图片

Python爬取六间房小姐姐自拍小视频

三分钟教会你用Python爬取心仪小姐姐图片

Python实练（1）爬取‘喵写真’站上的小姐姐图片

玩爬虫不就是为了多爬取几个小姐姐吗，几十行代码快速获取小姐姐视频？

想爬取各大网站的小姐姐？这份爬虫速成指南送你了！包学会哦！

Python爬虫教程——美空网未登录图片爬取！这个网站这么多小姐姐

百行代码，python爬取小姐姐网100G套图，别流鼻血，身体重要！

华侨程序员爬取识别十万不可描述行业小姐姐，网友：你还是人吗？

scrapy实战爱汉服并分类下载图片，美好的一天从爬取漂亮的汉服小姐姐开始

2021最新版Python爬取无水印小姐姐短视频，超级简单！（附视频/源码）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)