爬取简书图片(使用BeautifulSoup) - 代码天地

爬取简书图片(使用BeautifulSoup)

其他 2019-08-09 11:18:20 阅读次数: 0

import requests
from bs4 import BeautifulSoup
url_list = []
kv = {'User-Agent':'Mozilla/5.0'}
r = requests.get('https://www.jianshu.com/p/42df25cfc1ec',timeout=30,headers = kv)
# print(r.request.headers)
dome = r.text
soup = BeautifulSoup(dome,'html.parser')
# print(soup.prettify())

img_ = soup.find_all('img')
for i in img_:
    # print(i.get('src'))
    if i.get('data-original-src') != '//cdn2.jianshu.io/assets/web/nav-logo-4c7bbafe27adc892f3046e6978459bac.png' and i.get('data-original-src') != None:
        url_list.append(i.get('data-original-src'))
for i in url_list:
    image_name = i.split('/')[-1]
    response = requests.get(f'https:{i}')
    image_data = response.content
    with open(f"./image/{image_name}",'wb') as fw:
        fw.write(image_data)

猜你喜欢

转载自www.cnblogs.com/kuck/p/11325922.html

爬取简书图片(使用BeautifulSoup)

爬取简书

使用BeautifulSoup去爬取豆瓣图片

使用BeautifulSoup爬取百度图片

使用BeautifulSoup爬取图片入门篇

scrapy简书整站爬取

利用Python爬取简书

requests与BeautifulSoup爬取网页图片

使用beautifulsoup爬取丁香网评论

Python使用BeautifulSoup爬取网页信息

使用beautifulSoup库爬取小说

使用Selenium和chromedriver爬取简书部分文章

python使用requests和BeautifulSoup包爬取Pixiv图片--指定tag下的所有作品

实战：爬取简书之搭建程序框架

博客搬家系列（四）-爬取简书文章

爬虫实战----简书的爬取和存储

简书全站爬取 mysql异步保存

实例学习——爬取简书网热评文章

爬虫实战——简书文章爬取（selenium+Chrome）

爬虫练习-爬取简书网热评文章

使用python爬取图片

使用Python的BeautifulSoup爬取赶集网

使用BeautifulSoup爬取外汇数据及用法整理

python使用requests和BeautifulSoup爬取网页乱码问题

使用Requests和BeautifulSoup爬取妹子图

使用requests+BeautifulSoup爬取龙族V小说

Python使用BeautifulSoup与Requests爬取大学排名

python使用beautifulsoup4爬取酷狗音乐

Python使用BeautifulSoup与selenium爬取Boos直聘

使用BeautifulSoup爬取无锡美团美食店铺数据

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)