放棄するエントリからday02パイソン----エンドウゲームの情報をクロール

BS4 輸入BeautifulSoup
 インポート要求

デフGet_Data(URL):
    応答 = requests.get(URL)
     の戻り応答

デフANALYSIS_DATA(データ):
    App_Dataに = Data.find_all(class_がする= ' カード' を返すApp_Dataに
    
デフSave_Data(FILE_NAME、App_Dataには):
    APP_NAME = App_Data.find(名前= ' IMG ')に.get(' ALT ' 
    App_Link = App_Data.find(名前= ' ')に.get(' のhref ' 
    App_Num = App_Data.find(NAME = ' スパン'、class_が= 'COUNTインストール' )の.text 
    APP_SIZE = App_Data.find(class_が= ' メタ').find_all(名= ' スパン')[2]に.get(' タイトル' 
    データ = F '' ' 
    アプリ名:{} APP_NAME 
    リンクをダウンロード:{App_Link} 
    ダウンロード数:{} App_Num 
    アプリサイズ:APP_SIZE} { 
    \ N- 
    ' ''
    印刷(データ)
    のオープンと(file_name.replace(' / '' _ ')+ " .txtファイル"" A "、エンコード= ' UTF-8 ' )、Fとして:
        f.write(データ)
        f.close()
    
URL_LINK = ' HTTPS://www.wandoujia .COM /カテゴリ/ 6001 ' 
RES = Get_Data(URL_LINK)
データ = BeautifulSoup(Res.text、' lxmlの' 
App_Dataに = ANALYSIS_DATA(データ)
 、印刷(App_Dataに)
 のために App_Temp App_Dataに:
    Save_Data(' App_Info ' 、App_Temp)

プリント' 完了作業データダウンロード!'

 

おすすめ

転載: www.cnblogs.com/tankfaledeblog/p/11129520.html