セレンのpython爬虫類マニュアルの使用

いくつかの必要なライブラリ:

セレンインポートwebdriverを#webdriverをインポートライブラリ・ドライブ・ブラウザから

selenium.webdriver.common.keysからキー#ライブラリの呼び出しキーボードをインポート

インポート時#睡眠用

selenium.webdriver.support.uiインポートから明示を待って、#待機ループをWebDriverWait

条件を担当するEC番号モジュールとしてselenium.webdriver.supportから。輸入expected_condition

ブラウザ:

ドライバ= webdriver.Chrome()#は、ブラウザの代わりに、Googleのブラウザ、ドライバを開きます

#ウェブサイトを開きます( '')driver.get

ブラウザdriver.quit()#の近く

ポジショニングの要素:

driver.find_element_id( '')#位置決め要素(id属性)

driver.find_element_xpath( '')位(xpath属性によって)要素を探しコピーのXPath [] []絶対位置

その他:

  • find_element_by_id
  • find_element_by_name
  • find_element_by_xpath
  • find_element_by_link_text
  • find_element_by_partial_link_text
  • find_element_by_tag_name
  • find_element_by_class_name
  • find_element_by_css_selector

簡単に配置することができる要素の要素のための複数の要素を配置する(リストを返します)

位置決め要素の動作:

XXでxx.send_keys(「」)#何模倣キーボード入力(入力され、中国をuを追加する必要があります場合)

xx.click()#の模倣クリックXX

xx.clear(通常入力ボックスで使用される)#、ボックスの内容をクリア

xx.get_attibute(「のTextContent」)#取得、すべてのタグは、<>要素内のテキスト、戻り値strを次の

HTML内のxx.get_attribute( 'innerHTMLプロパティ')#取得するすべての要素

xx.get_attribute(「outerHTML」)#を取得するHTML選択された要素、すなわちを含む、含むHTML要素内の両方は、HTMLの層を含んでいます

xx.get_attribute(「label属性」)#要素タグ>値<プロパティを取得

ブラウザのウィンドウ:

driver.window_handles#は、ブラウザのハンドルすべてのウィンドウ[](リスト)を取得します

driver.swich_to.window(ハンドルを操作したい)#スイッチの窓

driver.close()#近い現在のハンドル/窓(空の後にオフドライバ)

明示的な待っています:

数秒のtime.sleep(S)#遅延(時間ライブラリ)

位置決め要素についてWebDriverwait(、).until()#待ち存在すると、タイムアウト例外が見つからない場合はTimeoutExceptionをスローされます

element = WebDriverWait(driver, 10).until(
        EC.presence_of_element_located((By.ID, "myDynamicElement"))
    )  #  10秒内不断加载页面,直到找到有这个id的元素或超时,并且定位这个元素为element

EC。のXXX#裁判官とは、着信タイトルのタイトルを獲得しました

xxxは次の通り:

  • 正確に等しいtitle_isの#
  • #取得title_containsは、着信含ま
  • #要素が正常にロードされているかどうかを決定します
  • presence_of_element_located(By.xxx、「プロパティの要素」)
  • presence_of_all_elements_located
  • #裁判官要素が表示されます
  • invisibility_of_element_located
  • visibility_of_element_located
  • visibility_of
  • #テキストが要素内に表示されるかどうかを決定します
  • text_to_be_present_in_element((By.xxx、 "プロパティの要素")、 "テキスト")
  • text_to_be_present_in_element_value
  • #裁判官フレームをカットすることができるかどうか
  • frame_to_be_available_and_switch_to_it
  • #判事クリック可能な要素かどうか
  • element_to_be_clickable((By.xxx、 "プロパティの要素"))
  • #裁判官はDOMにはまだありません
  • staleness_of
  • 要素が選択されているかどうか#判事
  • element_to_be_selected
  • element_located_to_be_selected
  • element_selection_state_to_be
  • element_located_selection_state_to_be
  • #ポップがあるかどうかを確認
  • alert_is_present

続くことができることで。ある多くの(現在唯一の存在が触れたために[])

 

  • ID
  • 名前
  • XPATH
  • LINK_TEXT
  • PARTIAL_LINK_TEXT
  • タグ名
  • クラス名
  • CSS_SELECTER 

 

クッキーを取得します。

driver.get_cookies()#GETクッキー(ないように注意してください)

出力ページのソース:

driver.page_source

xx.text:

要素XXの内容を返します。

セレン公式文書:https://selenium-python.readthedocs.io/

2本のビデオを入手:http://www.iqiyi.com/w_19ru4zw6w9.html?key=497e5c296ca7ff592f821e933523f96a&msrc=3_31_56&aid=7905573509&tvid=7905573509&cid=12&identifier=weixinv1&ftype=27&subtype=1&vip_pc=0&vip_tpc=0&p1=2_22_222&social_platform=qq_friend

http://www.iqiyi.com/w_19rvk5im2p.html?key=497e5c296ca7ff592f821e933523f96a&msrc=3_31_56&aid=9123889709&tvid=9123889709&cid=12&identifier=weixinv1&ftype=27&subtype=1&vip_pc=0&vip_tpc=0&p1=2_22_222&social_platform=qq_friend

公開された55元の記事 ウォン称賛40 ビュー210 000 +

おすすめ

転載: blog.csdn.net/hrainning/article/details/83541312