Seleniumはページ要素のhref属性を取得します

この記事では、Seleniumを介してページ要素の特定の属性を取得する方法を紹介します。要素には、クラス、ID、名前、テキスト、href、valeなどの複数の属性が含まれる場合があります。ここでは、クローラーで処理する必要のあるリンクの問題の例を示します。現在のページのすべてのハイパーリンクを見つけてください。

Baiduのホームページを例にとると、hrefを含むすべての要素へのリンクを印刷します。

関連するスクリプトコードは次のとおりです。

# coding=utf-8
import time
from selenium import webdriver
 
 
driver = webdriver.Chrome()
driver.maximize_window()
driver.implicitly_wait(6)
driver.get("https://www.baidu.com")
time.sleep(1)
 
for link in driver.find_elements_by_xpath("//*[@href]"):
    print (link.get_attribute('href'))
driver.quit()

これは、要素のhref属性を見つけるためだけのものです。他の属性が必要な場合、たとえば、id値を使用してページ上のすべての要素を表示する必要がある場合は、次のように記述できます。

print (link.get_attribute('id'))

おすすめ

転載: blog.csdn.net/zhuan_long/article/details/110129137