wallhaven壁纸网站改版后爬虫小例子 - コードワールド

wallhaven壁纸网站改版后爬虫小例子

その他 2021-11-17 18:52:05 訪問数: null

wallhaven壁纸网站改版后爬虫
新手上路，老司机绕路
最近学习python，尝试写一点小爬虫
这是改版后的wallhaven壁纸网站，爬取热门榜单。在这里插入图片描述首先对网站进行分析
按F12启动开发者工具，对网页进行分析。
现在页面上的图片都是缩略图没有爬取的意义，需要对源图片进行爬取，定位到图片的位置上，图片属性中有一个href属性，这个属性是超链接，所以我们根据herf属性进一步爬取，打开其href属性中的网页。在这里插入图片描述
就得到了这张图片的源图片，而不是缩略图，然后使用爬虫对图片进行保存就可以了。
下面是对wallhaven网站的Toplist榜单进行爬取的小例子。
注意文件路径和获取范围根据个人调整

代码如下：

import requests
from  lxml import etree
headers={
	"User-Agent" : "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:64.0) Gecko/20100101 Firefox/64.0"
	}

filepath="D:/Picture/wallhaven/"  #文件路径

for i in range(1,11):  #爬取页数
	kv={"page":i}
	
	url="https://wallhaven.cc/toplist"
	try:
		r=requests.get(url,headers=headers,params=kv,timeout=200)
		
		#开始解析
		html =etree.HTML(r.text)
		srcs =html.xpath(".//li//a[@class='preview']/@href")    #获取到跳转网页
		
		for src in srcs :
			r=requests.get(src,headers=headers,timeout=200)
			html =etree.HTML(r.text)
			img_src =html.xpath(".//img[@id='wallpaper']/@src")
			for src in img_src :
				filename_1= src.split('/')[-1] #获取文件名
				response=requests.get(src,headers=headers)		
						
				with open(filepath+filename_1,'wb') as file:
					file.write(response.content)
					print(filename_1)
				print("Succeed")

		except:
			continue
			print("跳过")		
	print("Triumph")

おすすめ

転載: blog.csdn.net/ErLang9527/article/details/90727198

wallhaven壁纸网站改版后爬虫小例子

wallhaven壁纸网站改版后爬虫小例子

map小例子

网站改版需要注意什么？企业网站改版需要注意的五大事项

学习QT的小例子_时钟

多线程售票小例子

关于链表的一个小例子

[软件需求工程]小爬虫

线性查找小例子01_java数据结构

SOUI的一个动态创建控件的小例子

Python爬虫之网站验证码识别（三）

爬虫類小さな例

LouGou小さな爬虫類

最新wordpress黑金壁纸微信小程序二开修复版源码下载支持流量主收益

改版学校官网

linux下线程的各个接口，并附带一个线程的小例子

STM32与串口（Usart)的通俗介绍与使用（例子：串口控制小灯）

小程序中转换类型后相加还是string类型

小技巧——vscode 保存代码后自动格式化

服务器IIS中所有网站打开后，自动跳转到//index.html

小さなPythonの爬虫類を取得

Python_戦闘小さな爬虫類_requests

python--小さな爬虫類ケース

三つの小さな爬虫類の栗

2匹の小さな爬虫類を行使

基于Spark的新闻推荐系统，包含爬虫项目、web网站以及spark推荐系统

爬虫学习记录（四）————利用pyquery，re爬取静态网站信息存储到mongodb中

#Python爬虫#Item Pipeline介绍(附爬取网站获取图片到本地代码)

从视频分享网站获取视频信息及下载链接：一个Python爬虫实战案例

PY爬虫類 - 三つの小さな爬虫類の栗

おすすめ

NYSEの技術的問題によりバークシャー・ハサウェイ(BRK.A)はほぼ100％下落

ランキング

Jieluanzihuai V

Deep Learning Made Easy: プーリング操作は変換モデルで何を参照していますか?

どのような共通の属性のCSS3ボックスサイジング？役割は何ですか？

CSP2019-Sが移動します

Pythonの定量的株取引（11）--- pyqt5を使用して株取引ソフトウェアのホームページを構築する

Python ディープラーニングは、発生したエラー報告の問題を解決します 3

バースト解析を示す 2D マップ

コード書かpycharmを実行するためのPythonのコマンドライン

mybatisplus はクエリの重複を排除するためにどのように使用しますか

Sparkメモリ管理の詳細な説明

アーカイブ

もっと

2024-06-03(1)

2024-06-02(0)

2024-06-01(1)

2024-05-31(1)

2024-05-30(0)

2024-05-29(1)

2024-05-28(0)

2024-05-27(1)

2024-05-26(0)

2024-05-25(1)