セレンサイクルクローラの問題解決

まず、開いている複数のブラウザ発行
サイクルを直接以下のコードで、複数のサイトを登ります:

 driver = webdriver.Firefox()
 driver.get(url)

すべてのドライバ一度と呼ばれるクロールの方法により、このサイクルは、受け入れることは非常に困難を何回も開くブラウザウィンドウを開きますが、あなたはヘッドレス操作を使用することができるように、システムは、立つことができない場合は、ソースコードへの窓の直接アクセスを開けないでください。

option = webdriver.FirefoxOptions()
option.set_headless()
driver = webdriver.Firefox(firefox_options=option)

この問題を解決するポップ。
第二に、エラーの問題
の多くのサイクルがwebdriver.Firefoxは()、selenium.common.exceptions.WebDriverExceptionを与えて呼び出す:メッセージ:接続が拒否、私はエラーになり、閉じない、あまりにも主にバックグラウンドでブラウザを開いているためと思うが、私はそうセレンアナログブラウザでpage_sourceを取得した後、呼び出し終了()関数は、もはやが与えられていないされた後、ブラウザを閉じました。コードは以下の通りであります:

driver.get(url)
content = driver.page_source
firefox_driver.quit()

第三に、オープニングwebdriverを誤り
しばしばgeckodriverがインストールされていないが、エラーメッセージが表示されます:「geckodriver」実行可能なニーズをするために PATHになり、 ダウンロードgeckodriverckodは、Ubuntuのエラーには、/ usr / local /ビン/パスの下に解凍プットは、解決することができるときエラー。

リリース9件のオリジナルの記事 ウォンの賞賛2 ビュー3083

おすすめ

転載: blog.csdn.net/xiaokan_001/article/details/88427414