Day03:エンドウのゲーム情報をクロール

インポート要求が
再インポート
デフget_page(URL):
    応答 =リクエストを。取得(URL)
     の戻り応答

デフparse_index(HTML):
    game_list = re.findall(
         。?。?<DIV CLASS = "アイコンラップ"> * <a href="(.*?)"> * </ A >。*?</ div>。*?<H2 CLASS = "アプリタイトル-H2">。*?<のhref = "(。*?)"タイトル= "(。*?)"クラス= "名前">(。*?)する</a> </ H2>。*?<スパンクラス="カウントをインストール">(。*?)</ span>を。*?<スパンのタイトル="(。*?) 「>(。*?)</ span>を(。*?)</ div> " 
        HTML、
        再。
    
F = '' '
     =============================== 
    ゲーム名:{} APP_NAME 
    ゲーム詳細ページのURL:{} detail_url 
    ゲームのダウンロード:{} download_num 
    ゲームサイズ:{} APP_SIZE
     =============================== 
    \ N- 
    '' '
     印刷(データ)
    を開く(と' wandou.txt '' A '、エンコード= ' UTF-8 'AS F:
        f.write(データ)
        を印刷(F ' ゲーム:{APP_NAME}が正常に書き込まれ... ' 

IF == __name__ ' __main__ ' 
    URL = F' https://www.wandoujia.com/category/6001 ' 
    プリント(URL)
    index_res = get_page(URL)
    game_list = parse_index(index_res.text)
     のためのゲームgame_list:
        save_data(ゲーム)

 

おすすめ

転載: www.cnblogs.com/zhoujie333/p/11129331.html
おすすめ