python爬取网页小姐姐 - 代码天地

python爬取网页小姐姐

其他 2020-07-29 11:51:41 阅读次数: 0

代码：

import requests
import os
import re

# url = ‘https://www.vmgirls.com/13708.html’

# url = ‘https://www.vmgirls.com/13810.html’
file_name = r’.\img’

headers = {

    ‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:75.0) Gecko/20100101 Firefox/75.0’,

    # ‘Referer’: ‘https://www.vmgirls.com/13708.html’
}
def download(img_url):

    # 如果没有创建图片目录则创建
    if not os.path.exists(file_name):
        os.makedirs(file_name)

    # 图片名称
    img_name = img_url.split(‘/’)[-1]

    # timeout = 5间接时间爬取
    f = requests.get(img_url, headers=headers, timeout=1)

    # 下载图片
    with open(‘{}/{}’.format(file_name, img_name), ‘wb’) as code:
        code.write(f.content)
def main():

    # 爬取13000—14000之间得所有图片网页

    print(“数值范围越大速度越慢”)

    start = input(“请输入数值开始范围’12000′:”)

    stop = input(“请输入数值结束范围’14000′:”)

    print(‘strat!!’)

    i = (int(stop))-(int(start))

    for num in range(i):

        url = ‘https://www.vmgirls.com/’+str(int(start)+int(num))+’.html’

        # print(num)

        html = requests.get(url, headers=headers)
        # 链接正常开始下载
        if html.status_code == 200:
            # 正则表达式提取链接和名字保存到字典
            urls = re.findall(
                ‘<a href=”(.*?)” alt=”.*?” title=”.*?”>’, html.text)
            # 传入字典开始下载
            for item in urls:
                print(item)
                download(item)
if __name__ == ‘__main__’:
    main()
    print(‘over’)


总结：本来我是没有认真学习python的准备但是在爬虫的过程中我觉得这门语言可以给我带来不少的编译，它可以实现一种我心中一直在想的自动化的过程，比如说自动寻找我需要的文本资料，批量下载一个网页中我需要的东西，自动监控定时发送信息，最后要告戒自己编程语言只是一种工具，不要为了学习语言而学习，重要的是培养逻辑思维能力。
项目链接：https://github.com/Stylle/Project/tree/master/Gril_Python

猜你喜欢

转载自blog.csdn.net/qq_43581670/article/details/107604738

python爬取网页小姐姐

爬取性感小姐姐

python爬取各大网站的小姐姐

python爬虫-爬取你想要的小姐姐

python3 爬取小姐姐图片

简单的爬虫爬取小姐姐

简单爬取小姐姐的照片

js混淆爬取小姐姐壁纸

Python爬虫之如何爬取抖音小姐姐的视频

【python】爬虫爬取美丽小姐姐图片美女壁纸

python爬虫(八、爬取图片社的小姐姐图片并下载)

Python爬虫实战：爬取小姐姐最近的听歌曲目

一个简单的实例操作入门python爬虫--爬取漂亮小姐姐的图片

Python爬取六间房小姐姐自拍小视频

三分钟教会你用Python爬取心仪小姐姐图片

Python实练（1）爬取‘喵写真’站上的小姐姐图片

java爬虫WebMagic框架爬取小姐姐的图片

爬取某直播网站首页小姐姐的照骗

爬取某婚恋网站数千小姐姐头像

Python爬虫教程——美空网未登录图片爬取！这个网站这么多小姐姐

百行代码，python爬取小姐姐网100G套图，别流鼻血，身体重要！

2021最新版Python爬取无水印小姐姐短视频，超级简单！（附视频/源码）

网络爬虫之爬小姐姐的写真python

爬虫实战：要不是热爱学习，谁会爬小姐姐。分析Ajax来爬取今日头条街拍美图（python）

Python程序员教你爬小姐姐！每个网站的小姐姐都是我的囊中之物！

python爬取网页

【Python爬虫系列教程 27-100】通过selenium爬取中国知网的中的Python文献信息，小姐姐突然觉得自己变成大神

又写了个爬取小姐姐图片的爬虫，（比上次写的稍微复杂了点）

Requests库入门——应用实例-网络图片的爬取与保存（好看的小姐姐≧▽≦）

手把手教你爬取小姐姐视频

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)