简单爬取小姐姐的照片 - 代码天地

简单爬取小姐姐的照片

移动开发 2020-08-15 10:18:11 阅读次数: 0

使用环境

win10系统，python

先简单开始访问，获取html从而提取所需数据

import requests
url = 'https://www.douyu.com/g_yz'
response = requests.get(url=url)
html = response.text
print(html)

将输出结果往下拉，指导看到jpg相关的如下图所示

接着就利用简单的正则表达式进行提取

import re
title_url = re.findall(r'"rn":"(.*?)","rpos":0,"rs1":"(.*?)"',html)
for title,one_url in title_url:
    print(title+"=================="+one_url)

下图便是相关结果
在这里插入图片描述

对于一个图片的下载如下所示

with open('一贫如洗的直播间 5695362.jpg','wb') as f:
    resp = requests.get(url='https://rpic.douyucdn.cn/live-cover/appCovers/2020/06/21/5695362_20200621173529_big.jpg/dy2').content
    f.write(resp)

下面是保存成功的图片
在这里插入图片描述

那么在一个循坏里也是同理的

for title,one_url in title_url:
    with open(title+'.jpg','wb') as f:
        resp = requests.get(url=one_url).content
        f.write(resp)
    print(title+'======================保存成功')

输出结果：
在这里插入图片描述

看成品

在这里插入图片描述
优化后的源码如下：

import requests
import re
import os
import time

url = 'https://www.douyu.com/g_yz'
response = requests.get(url=url)
html = response.text


title_url = re.findall(r'"rn":"(.*?)","rpos":0,"rs1":"(.*?)"',html)
os.chdir('小姐姐\\')
for title,one_url in title_url:
    with open(title+'.jpg','wb') as f:
        resp = requests.get(url=one_url).content
        f.write(resp)
    print(title+'======================保存成功')
    time.sleep(0.5)

猜你喜欢

转载自blog.csdn.net/A728848944/article/details/108009311

简单爬取小姐姐的照片

简单的爬虫爬取小姐姐

爬取性感小姐姐

python爬取网页小姐姐

js混淆爬取小姐姐壁纸

一个简单的实例操作入门python爬虫--爬取漂亮小姐姐的图片

java爬虫WebMagic框架爬取小姐姐的图片

爬取某直播网站首页小姐姐的照骗

python爬取各大网站的小姐姐

python爬虫-爬取你想要的小姐姐

python3 爬取小姐姐图片

爬取某婚恋网站数千小姐姐头像

2021最新版Python爬取无水印小姐姐短视频，超级简单！（附视频/源码）

python3网络爬虫--使用Ip代理爬取新浪微博上小姐姐照片（附源码）

国庆在家太无聊，用Java爬了上千张小姐姐照片...

又写了个爬取小姐姐图片的爬虫，（比上次写的稍微复杂了点）

Requests库入门——应用实例-网络图片的爬取与保存（好看的小姐姐≧▽≦）

Python爬虫之如何爬取抖音小姐姐的视频

【python】爬虫爬取美丽小姐姐图片美女壁纸

python爬虫(八、爬取图片社的小姐姐图片并下载)

Python爬虫实战：爬取小姐姐最近的听歌曲目

手把手教你爬取小姐姐视频

Python爬取六间房小姐姐自拍小视频

三分钟教会你用Python爬取心仪小姐姐图片

Python实练（1）爬取‘喵写真’站上的小姐姐图片

玩爬虫不就是为了多爬取几个小姐姐吗，几十行代码快速获取小姐姐视频？

想爬取各大网站的小姐姐？这份爬虫速成指南送你了！包学会哦！

Python爬虫教程——美空网未登录图片爬取！这个网站这么多小姐姐

百行代码，python爬取小姐姐网100G套图，别流鼻血，身体重要！

华侨程序员爬取识别十万不可描述行业小姐姐，网友：你还是人吗？

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)