I.はじめに
最近、教師を支援するWebコンテンツをクロール、私は、ページがセレンにここで使用し、データのすべてのページを取得するために、動的にロードされました。セレンは、実際のブラウザをシミュレートすることができ、Webアプリケーションのテストのためのツールであり、ちょうど同じ操作で実際のユーザーとして、複数のブラウザをサポートしていますが、ブラウザで直接実行されます。
環境:win10 64ビット+ python3.6 +クローム78.0.3904.108 64ビット
第二に、インストール
注:次のインストール構成は、すべての参照ブロガー独自のシステム環境設定です
セレンinstallコマンドを1.python:
ピップセレンをインストール
2.ダウンロードchromedriver.exe
chromedriver.exeファイルはので、ここで我々は彼らのクロームバージョンに応じて、正しいchromedriverを選択する必要があり、Googleのブラウザのさまざまなバージョンが異なるchromedriverに対応し、クロムドライバを呼び出すことです。ダウンロードchromedriverの:http://chromedriver.storage.googleapis.com/index.html
例えば、私のChromeバージョン78.0.3904.108には、次の通り:
だから、私はchromedriverバージョンは次のようになります:(上記78.0.3904.108はない、私はちょうど明らかに78.0.3904.105バージョンが108よりも低く、78.0.3904.11で、OKでこのバージョンよりも少し高いを選択して選択しました適し)
chromedriver_win32.zipダウンロードを選択
3.次のようにchromedriver.exeは、クロームのインストールディレクトリにダウンロード:
4.設定しPathに加え、クロムのパスにシステム環境変数は、次の通り:
第三に、基本的な使い方
上記セレン環境をインストールして設定した後、あなたのpythonをテストするためのプログラムを書くことができます
次のようにテストコードがあります:
from selenium import webdriver # 打开chrome浏览器(需提前安装好chromedriver) browser = webdriver.Chrome() print("正在打开网页...") browser.get("http://www.baidu.com")
效果如下: