I.はじめに
新しいクローラーツールに触れるたびに、さまざまな壁紙サイトを使って「4kビューティー」を3回獲得して試してみるのが好きです。またここにいます。今日PyQueryを使用してみてください。
第二に、実現プロセス
1.PyQueryの基本的な使用法を理解する
ここで私はブロガーの記事を参照しています:ポータル
2.Webページをある程度理解している
3回得点しましたが、このサイトは理解できますか?ポータルポータル
初めての友達は、このウェブサイトを分析する私の以前の記事、記事ポータルを読むことができます
3.コードを実行します
from pyquery import PyQuery as pq
import requests
url = 'http://pic.netbian.com/4kmeinv/'
html = requests.get(url=url).text
doc_1 = pq(html) # 字符串初始化
data_s = doc_1('.slist .clearfix li a').items() # 使用CSS选择器进行定位,定位节点过多,需要遍历一下
for list_s in data_s:
image_url = 'http://pic.netbian.com/' + list_s.attr.href # 提取a节点中的href属性,并得到一个新的链接
image = requests.get(image_url).text # 访问第二个页面
doc_2 = pq(image) # 字符串初始化
contents = 'http://pic.netbian.com/' + doc_2('#img img').attr.src # 依然是CSS选择器,提取img节点的src属性
print(contents) # 打印链接结果
写真の最終的な高解像度の全体像へのリンクは次のとおりです。ダウンロードする場合は、上記の記事を参照してください。
4.実行結果
補足:もともと実行結果のgifを記録したかったので、最初の実行を除いて、それ以外の時間は速度が遅くなりました。それがインターネット速度の理由かどうかはわかりません。大物はコメントエリアでいくつかの提案をすることを歓迎します