PhantomJSは、インターフェースレスでスクリプト可能なWebKitブラウザーエンジンであり、DOM操作、CSSセレクター、JSON、Canvas、SVGなどのさまざまなWeb標準をネイティブにサポートします。
SeleniumはPhantomJSをサポートしているため、実行時にブラウザーがポップアップすることはありません。また、PhantomJSは運用効率が高く、さまざまなパラメータ設定に対応しているため、非常に便利です。PhantomJSのインストールプロセスを見てみましょう。
1.関連リンク
-
公式サイト:http://phantomjs.org
-
ダウンロードリンク:http://phantomjs.org/download.html
-
APIインターフェースの説明:http://phantomjs.org/api/command-line.html
2.PhantomJSをダウンロードします
対応するインストールパッケージを公式ウェブサイトからダウンロードする必要があります。PhantomJSは、Windows、Linux、Mac、FreeBSDなどの複数のオペレーティングシステムをサポートしています。対応するプラットフォームを選択して、インストールパッケージをダウンロードできます。
ダウンロードが完了したら、PhantomJS実行可能ファイルが環境変数に配置されるパスを構成します。たとえば、Windowsでは、ダウンロードしたファイルを解凍して開くと、実行可能ファイルphantomjs.exeを含むbinフォルダーが表示されます。環境変数が構成されているパスまたはその場所のすぐ下に配置する必要があります。構成環境変数へのパス。たとえば、Python Scriptsフォルダーに直接コピーするか、それが配置されているbinディレクトリを環境変数に追加することができます。
Windowsでの環境変数の構成については、セクション1.1を参照してください。LinuxおよびMacの環境変数の構成については、ここでは繰り返さないセクション1.2.3を参照してください。重要なのは、 PhantomJSの実行可能ファイルを環境変数に追加します。
構成が成功したら、コマンドラインで次のように入力してテストできます。
phantomjs
PhantomJSのコマンドラインに入ることができれば、図1-21に示すように、構成が完了したことを証明します。
図1-21コンソール
3.インストールを確認します
Seleniumで使用する場合は、ChromeをPhantomJSに切り替えるだけで済みます。
セレンからインポートwebdriverbrowser = webdriver.PhantomJS() browser.get( 'https://www.baidu.com') print(browser.current_url)
実行後、ブラウザのポップアップは表示されませんが、実際にはPhantomJSはすでに実行されています。ここでBaiduにアクセスし、現在のURLを印刷しました。
コンソールの出力は次のとおりです。
1 https://www.baidu.com/
このようにして、PhantomJSの構成が完了しました。これを使用して、後でページのクロールを完了することができます。