Pythonの爬虫類:クロールエンドウAPP最初のページデータ情報(セレン)

セレン輸入webdriverをから
インポート時の

ドライバ= webdriver.Chrome(R'C:\ユーザーはAuraro \デスクトップ/ chromedriver.exeを\ ')

試してみてください。
    driver.implicitly_wait(20)
    driver.get(' https://www.wandoujia.com /カテゴリ/ 6001 ')

    time.sleep(5)
    js_code = ''' 
                   window.scrollToは(0,5000)
                   ''」
    driver.execute_script(js_code)

    time.sleep(5)#商品信息加载、等待5S 
    app_list =ドライバ.find_elements_by_class_name( 'カード')
    app_listでのアプリのために:
        #アプリ名称
        。APP_NAME = app.find_element_by_css_selector( 'アプリタイトル-H2のA')テキスト

        #详情页URL
        。detail_url = app.find_element_by_css_selector( 'のAppタイトル-H2-A')GET_ATTRIBUTE( 'のhref')

        ダウンロードの#番号
        #アプリのサイズ
        。download_num_size = app.find_element_by_class_name( 'メタ')テキスト

        app_content = "" " 
            アプリケーション名:{ } 
            {}:ページのURLの詳細
            のダウンロード数:{} 
            アプリのサイズ:{} 
            \ N- 
        ""」.format(APP_NAME、detail_url、download_num_sizeの[:。:8]、download_num_sizeの[11])
        印刷(app_content)を
        開きます(「エンドウとapp.txtポッド'' A 'エンコード=' UTF-8「)、F AS:
            f.write(app_content)
    time.sleep(3)。


最後に:
    driver.close()

  

おすすめ

転載: www.cnblogs.com/Auraro997/p/11128757.html