1. Selenium モジュールとは何ですか? - ブラウザベースの自動化のためのモジュール。(コードを記述することで、ブラウザに操作自動化アクションを完了させます) Selenium モジュールを使用すると、動的に読み込まれるデータを簡単に取得できます。2. Selenium の使用プロセス: - 環境のインストール - ブラウザ ドライバー (Google Chrome) のダウンロード - ダウンロード パス: http:/ /chromedriver.storage.googleapis.com/index.html - ドライバーとブラウザの対応: http://blog.csdn.net/huilan_same/article/details/51896672 ダウンロード後、呼び出すことができます。3. 手順: 1. まず、ページにデータが動的にロードされているかどうかを確認します。 2. パケット キャプチャ ツールを通じて応答に対応し、データ パケット内のグローバル検索を実行します。動的にロードされたデータを取得するにはどうすればよいですか? 1. Selenium を使用すると、動的にロードされたデータを簡単に取得できます。 2. 模擬ログイン (Renren、qq 模擬ログインなど) を実行して、模擬ログインを容易にします。
例: オブジェクトをインスタンス化します。
from selenium import webdriver
from lxml import etree
from time import sleep
#实例化一个浏览器对象(传入浏览器的驱动对象
bro = webdriver.Chrome(executable_path='./chromedriver') #括号里跟一个参数,然后返回一个bro
# - 接下来就可以编写基于浏览器自动化的操作代码了
bro.get('http://125.35.6.84:81/xk/')#让浏览器发起一个指定url对应请求
#获取浏览器当前页面的源码数据(动态)
page_text=bro.page_source #这是一个属性,返回这个页面的page_text,可以帮我们获取当前页面所对应的源码数据
#解析数据,可以用xpath啦
tree=etree.HTML(page_text)
li_list=tree.xpath('.//ul[@id="gzlist"]/li') #这个xpath返回的是一个列表,列表存的是ul标签
for li in li_list:
name=li.xpath('./dl/@title')[0]
print(name)
# - 运行完之后可以关闭,但是关闭之前可以让他停留一段时间再关闭,记得导入sleep
sleep(5) #停留5秒之后再关闭
bro.quit()
4. Selenium には、より自動化ベースの操作が追加されています 。 Taobao を開き、検索ボックスに製品名を入力し、検索ボックスをクリックして検索を許可します。 -リクエスト の開始: get(url) - ラベルの配置: シリーズ メソッドの検索 - ラベルインタラクション: send_keys('xxx') - JS プログラムの実行:execute_script('jsCode') - 前方、後方: back(),forword() - ブラウザを閉じる: quit()