Python: Selenium モジュールの基本的な使用法

1. Selenium モジュールとは何ですか?  
- ブラウザベースの自動化のためのモジュール。(コードを記述することで、ブラウザに操作自動化アクションを完了させます) 
Selenium モジュールを使用すると、動的に読み込まれるデータを簡単に取得できます。2. Selenium の使用プロセス: 
- 環境のインストール
- ブラウザ ドライバー (Google Chrome) のダウンロード
- ダウンロード パス: http:/ /chromedriver.storage.googleapis.com/index.html 
- ドライバーとブラウザの対応: http://blog.csdn.net/huilan_same/article/details/51896672
 ダウンロード後、呼び出すことができます。3. 手順: 
1. まず、ページにデータが動的にロードされているかどうかを確認します。
2. パケット キャプチャ ツールを通じて応答に対応し、データ パケット内のグローバル検索を実行します。動的にロードされたデータを取得するにはどうすればよいですか? 
1. Selenium を使用すると、動的にロードされたデータを簡単に取得できます。
2. 模擬ログイン (Renren、qq 模擬ログインなど) を実行して、模擬ログインを容易にします。








 

例: オブジェクトをインスタンス化します。

from selenium import webdriver
from lxml import etree
from time import sleep
#实例化一个浏览器对象(传入浏览器的驱动对象
bro = webdriver.Chrome(executable_path='./chromedriver') #括号里跟一个参数,然后返回一个bro

        # - 接下来就可以编写基于浏览器自动化的操作代码了

bro.get('http://125.35.6.84:81/xk/')#让浏览器发起一个指定url对应请求

#获取浏览器当前页面的源码数据(动态)
page_text=bro.page_source    #这是一个属性,返回这个页面的page_text,可以帮我们获取当前页面所对应的源码数据

#解析数据,可以用xpath啦
tree=etree.HTML(page_text)
li_list=tree.xpath('.//ul[@id="gzlist"]/li')   #这个xpath返回的是一个列表,列表存的是ul标签
for li in li_list:
    name=li.xpath('./dl/@title')[0]
    print(name)
    # - 运行完之后可以关闭,但是关闭之前可以让他停留一段时间再关闭,记得导入sleep
sleep(5)  #停留5秒之后再关闭
bro.quit()

4. Selenium には、より自動化ベースの操作が追加されています
。 Taobao を開き、検索ボックスに製品名を入力し、検索ボックスをクリックして検索を許可します。 -リクエスト
      の開始: get(url) 
      - ラベルの配置: シリーズ メソッドの検索
      - ラベルインタラクション: send_keys('xxx') 
      - JS プログラムの実行:execute_script('jsCode') 
      - 前方、後方: back(),forword() 
      - ブラウザを閉じる: quit()

おすすめ

転載: blog.csdn.net/leowutooo/article/details/124998342
おすすめ