【Python】打刻学習9日目 - Selenium自動操作ブラウザ(下)


イベントアドレス: CSDN 21 日間学習チャレンジ

学ぶ最大の理由は凡庸を脱却することだが、一日も早くなれば人生はもっと輝かしいものになるだろう。
ある専門知識を体系的・深く学びたい…
人で継続的に学習するのは難しい、グループで効率よく学びたい…
ブログを書きたいけど始められない… 、そして緊急に乾物を書くことにエネルギーを注入する必要があります...
書くことが大好きで、自分自身をより良い人間にさせたいと思っています

...

CSDN ラーニング チャレンジへの参加を歓迎し、より良い自分になりましょう。イベント内の高品質コラム ブロガーの無料の高品質コラム リソースを参照してください (高品質リソースのこの部分は無料で、限定公開されています)イベントの時間~)、自分の学習分野と学習の進捗状況に応じて、自分の学習プロセスを学習し、文書化します。次の 3 つの側面から 1 つを選択して開始することも (必須ではありません)、次のように自分の理解に応じてコラム学習作品を公開することもできます。

**

勉強日記

**
1. 知識ポイントの学習

セレンのAPI

2. 学習中に遭遇した問題

APIは触っていない

3. 学習効果

SeleniumのAPIの使い方

4. 実際の操作

インターフェースモードなし:

SeleniumインポートWebドライバーから

# 1. 構成オブジェクトをインスタンス化します
chrome_options = webdriver.ChromeOptions()
# 2. ヘッドレス コマンド
chrome_options.add_argument('--headless')を有効にする
構成オブジェクトを追加します # 3. GPU コマンド
chrome_options を無効にする構成オブジェクトを追加します。 add_argument('-- disable-gpu')
# 4. 構成オブジェクトを使用してブラウザ オブジェクトをインスタンス化する
browser = webdriver.Chrome(chrome_options=chrome_options)

ブラウザ.get('https://www.baidu.com/')

# リクエストされたデータを表示します
print(browser.page_source) # レンダリングされたデータを表示します。Xpath で解析してデータを取得できます
print(browser.get_cookies()) # リクエスト ページの後の Cookie 値を表示します print
(browser.current_url) # リクエストURLを表示

# ページを閉じる
browser.close()
# ブラウザを閉じる
browser.quit()

IDを取得:

selenium.webdriver.common.by からインポート

# 最初の要素を取得する
browser.find_element(by=By.ID, value="list-1")
# 複数の要素を取得する
browser.find_elements(by=By.ID, value="list-1")

テキストを取得します:

ret = browser.find_element_by_class_name('要素')
print(ret[0].text)

Web ページの前後方向:

# ブラウザを転送する
.forward()

# ブラウザに戻る 
.back()

IPプロキシ:

SeleniumインポートWebドライバー
インポート時間から

# 1. 構成オブジェクトのインスタンスを作成します
options = webdriver.ChromeOptions()
# 2. プロキシ IP を使用してコマンドを構成オブジェクトに追加します
options.add_argument('--proxy-server=http://ip address') # プロキシ IP: ポート番号
# 3. 構成オブジェクト
driver = webdriver.Chrome(chrome_options=options)
driver.get("https://www.baidu.com")を使用してドライバー オブジェクトをインスタンス化します。

# ページコンテンツを取得
print(driver.page_source)

# 3 秒の遅延後に現在のウィンドウを閉じます。最後のウィンドウの場合は、
time.sleep(3)
driver.close()を終了します。

リクエストヘッダーの変更:

SeleniumインポートWebドライバー
インポート時間から

Agent = 'Mozilla/5.0 (iPad; Mac OS X のような CPU OS 11_0) AppleWebKit/604.1.34 (KHTML、Gecko のような) バージョン/11.0 Mobile/15A5341f Safari/604.1' # 1. 構成オブジェクトのインスタンスを作成します options =
webdriver.ChromeOptions
( )
# 2. 構成オブジェクトの変更リクエスト ヘッダー
options.add_argument('--user-agent=' + Agent)
# 3. 構成オブジェクトを使用してドライバー オブジェクトをインスタンス化します
driver = webdriver.Chrome(chrome_options=options)
driver.get ("https: //www.baidu.com")

# ページコンテンツを取得
print(driver.page_source)

# 3 秒の遅延後に現在のウィンドウを閉じます。最後のウィンドウの場合は、
time.sleep(3)
driver.close()を終了します。

ありがとう:

Wuxian 氏のご指導に感謝します。この期間の学習と理解を通じて、Python の実践的な応用に関する経験が増えました。基礎がゼロで興味がある友人は、体系的に学習するために Wuxian コラムに移動することをお勧めします。学ぶ。 

おすすめ

転載: blog.csdn.net/qq_34217861/article/details/126453529