Pythonの爬虫類:クロールエンドウAPP最初のページデータ情報(要望)

インポート要求
BS4輸入BeautifulSoupのから

ウェブ= 'HTTPS://www.wandoujia.com/category/6001' 
web_g = requests.get(ウェブ)
web_code = BeautifulSoup(web_g.text、 'lxmlの')

名= web_code.find_all(名= 'リー'、クラス_ = 'カード')

名でiについて:
    GAME_NAME = i.h2.a.text 
    game_url = i.h2.a.attrs [ 'のhref'] 
    game_dl = i.find(クラス_ = 'install-カウント')テキスト
    game_size = i.find(クラス_ ='メタ')find_all(NAME ='スパン')[2] .attrs ['表題'] 

    =ゲーム' '' 
        名称游戏:{} 
        地址:{} 
        下载量:{} 
        游戏大小:{} 
        \ n 
    ''」.format(GAME_NAME、game_url、game_dl、game_size) 
    プリント(ゲーム)
    :オープン( 'game_list'、 ''、エンコード= 'UTF-8')、Fとして有する
        f.write(ゲーム)

  

おすすめ

転載: www.cnblogs.com/Auraro997/p/11128895.html