ExcelにWebコンテンツの保存

セレンインポートwebdriverをからの
時間インポートスリープから
selenium.common.exceptionsからはNoSuchElementExceptionをインポート
ワークブックopenpyxlインポートから

ドライバ= webdriver.Chrome()
driver.get( "https://tieba.baidu.com/index.html")

#場所検索ボックス
driver.find_element_by_xpath( '//入力[@ ID = "WD1"]')。Send_keys( " 日真央ブック")

場所検索ボタン#の
driver.find_element_by_xpath( '// [テキスト( )= " フル・検索バー"]')。クリック()
SLEEP(3)

#オープンExcelスプレッドシート
WB =ブック()
WS = wb.active
ws.append([ "タイトル"、 "内容"])
行2 =
ROW2 = 2

:真しばらく
title_list =リスト()
してみてください:
#定位标题
all_title = driver.find_elements_by_xpath( '//スパン[クラス@ = "p_title"]')
all_content = driver.find_elements_by_xpath( '// divの[クラス@ = "p_content" ] ')
all_titleにおけるタイトル:
ws.cell(行1、title.text)
プリント( "保存标题到エクセル表格中")
行=行+ 1

用all_contentのコンテンツ:
ws.cell(ROW2、2、content.text)
印刷( "Excel形式で保存する")
。ROW2 1 + = ROW2

wb.save( "./ data.xlsx")
定位下一页
driver.find_element_by_xpath( '// [クラス@ = "次"]')。()をクリックして
スリープ(3)

EとしてはNoSuchElementExceptionを除く:
ブレーク

おすすめ

転載: www.cnblogs.com/mary-ding/p/12190444.html