爬虫類21 - セレンの使用

1.取得クッキー情報

セレンインポートwebdriverをから


ドライバ= webdriver.Firefox()
driver.get( "https://www.baidu.com")

driver.get_cookiesでのCookieの():
    印刷(クッキー)#すべてのクッキーを取得します
指定されたCookieのためのプリント(driver.get_cookie( "PSTM"))#
driver.delete_cookie( "PSTM")#删除クッキー
driver.delete_all_cookies()#すべてのクッキーを削除します

  

2.ページ待ち

セレンインポートwebdriverをから
selenium.webdriver.support.ui輸入WebDriverWaitから
ECとしてselenium.webdriver.support輸入expected_conditionsから
によってselenium.webdriver.common.byインポートから
ドライバ= webdriver.Firefox()
driver.get( "https://www.baidu.com")

driver.implicitly_wait(20)#20秒待ってから、例外、暗黙の待機を投げます

WebDriverWait(#は10秒待って.until(ドライバ、10)は、明示的待ちます
    EC.presence_of_element_located(By.ID、 'safasefsd')#不在

driver.find_elements_by_id( "sdasdsdsdwqenjas")

  

3.マルチページ

セレンインポートwebdriverをから
selenium.webdriver.common.action_chainsからActionChainsをインポート

ドライバ= webdriver.Chrome()
driver.get( "https://www.baidu.com")

driver.execute_scriptは( "window.open( 'https://www.douban.com')")#は、新しいタブを開きます
driver.switch_to.window(driver.window_handles [1])
印刷現在のページ(driver.current_url)#ディスプレイドライバ
印刷(driver.page_source)#印刷、Webコンテンツ

  

4.エージェント

セレンインポートwebdriverをから
selenium.webdriver.common.action_chainsからActionChainsをインポート

オプション= webdriver.FirefoxOptions()
options.add_argument( "--proxy-サーバー=のhttp://125.110.75.250:9000")
ドライバ= webdriver.Firefox()
driver.get( "http://www.httpbin.org/ip")

  

おすすめ

転載: www.cnblogs.com/wcyMiracle/p/12500029.html