セレンはPythonの爬虫類を使用するのは簡単です

、セレンの基礎はじめとインストール

      1、セレンはじめに

         セレンはまたphantomJSノーブラウザインタフェースをサポートしていない、クロム、Firefoxの、Safariや他の主流のブラウザインタフェースを含むブラウザの様々なサポート自動テストツールのテストサイトです。

     2、インストールセレン

セレンをインストールするPIP

     3、ブラウザのドライバをインストール 

                セレンは、異なるブラウザ・ドライブ用3.0にアップグレードすると当たり前でした。あなたが別のブラウザのセレンドライブを使用する場合は、個別にダウンロードして駆動する別のブラウザを設定する必要があります。

          各ブラウザのダウンロード:                    

                Firefoxブラウザドライバ:geckodriver

               Chromeブラウザドライバ:chromedriver 

               IEブラウザドライバ:IEDriverServer

               エッジブラウザドライブ:MicrosoftWebDriver

               Operaブラウザドライバ:operadriver

               PhantomJSブラウザドライバ:PhantomJS

               注:一部のブラウザでは、ネットワーク外のアドレスをドライブする必要があります。ブラウザウィンドウ駆動環境を設定します

                   ダウンロード後は、Ubuntuの環境を解凍は/ usr / binの中

二、セレン入門  

     配置1、セレン元素使用

               我々は、Webページを持っている場合は、要素のプロパティを表示するフロントエンド・ツール(例えば、Firebugの)です。               

<HTML> 
  <HEAD> 
  <BODYリンク= " #1 0000CC " > 
    <ID = " result_logo " HREF = " / "れるonmousedown = " 戻りC({ 'FM': 'タブ'、 'タブ': 'ロゴ'} )" > 
    <フォームID = " フォーム"  クラス = " FM " NAME = " F " ACTION = " / S " > 
      <スパンクラス = "soutu-BTN " > </ span>を
        <入力されたID = " KW"  クラス = " s_ipt " NAME = " WD "値= "" MAXLENGTH = " 255 "オートコンプリート= " オフ" > 
    <FORM /> 
  <BODY /> 
  <ヘッド/> 
<HTML />

私たちの目的は、入力ボックスの入力にラベルを配置することです。

  • ポジショニングIDで:
dr.find_element_by_id(" KW "
  • 名前による位置決め:
dr.find_element_by_name(" WD "
  • クラスであり名:
dr.find_element_by_class_name(" s_ipt "
  • タグ名を配置することにより:
dr.find_element_by_tag_name(" 入力"
  • XPathを配置することによって、一般的にここに記載されているいくつかの使用の書き込み、書き込みののXPath N種類の位置付け:
dr.find_element_by_xpath(" // * [@ ID = 'キロワット'] " 
dr.find_element_by_xpath(" // * [@名= 'WD'] " 
dr.find_element_by_xpath(" //入力[@クラス= 's_ipt '] " 
dr.find_element_by_xpath(" / HTML /本体/フォーム/スパン/入力" 
dr.find_element_by_xpath(" //スパン[@クラス=' soutu-BTN '] /入力" 
dr.find_element_by_xpath(" //フォーム[@ ID = '形態'] /スパン/入力" 
dr.find_element_by_xpath(" //入力[@ ID = 'KW'そして、名前@ = 'WD'] "
  • 位置決めCSS、書き込みのCSS位置N種類によって、いくつかは、一般的に使用される書き込みは、ここに記載されています:
dr.find_element_by_css_selector(" #kw " 
dr.find_element_by_css_selector(" [NAME = WD] " 
dr.find_element_by_css_selector(" .s_ipt " 
dr.find_element_by_css_selector(" HTML>ボディ>形態>スパン>入力" 
dr.find_element_by_css_selector(" span.soutu-BTN>入力#KW " 
dr.find_element_by_css_selector(" フォーム#形態>スパン>入力"

次に、私達のページ上のテキストリンクのセットがあります。

<a クラス = "mnav" href= "http://news.baidu.com"> "tj_trnews" name= 新闻</a>の
< クラス = " mnav "のhref = " http://www.hao123.com "名前= " tj_trhao123 " > hao123する</a>
  • テキストリンクを配置することにより:
dr.find_element_by_link_text(" 新闻" 
dr.find_element_by_link_text(" hao123 "
  • テキストリンクを配置することにより:
dr.find_element_by_partial_link_text(" " 
dr.find_element_by_partial_link_text(" ハオ" 
dr.find_element_by_partial_link_text(" 123 "

 

おすすめ

転載: www.cnblogs.com/talented-stefan/p/11627503.html