python猫の目の映画TOP100リストをクロールし、Excelに映画情報を書き込みます

- * -コーディング:UTF-8 - * - 
インポート要求
 から BS4のインポートBeautifulSoupの
 インポートxlrd、xlwt 

のURL = [
     " https://maoyan.com/board/4?offset= {} " .format(I)
     のために範囲(0,100,10 
] 

ヘッダー = {
 " ユーザエージェント"" はMozilla / 5.0(Windows NTの10.0; Win64の、のx64)のAppleWebKit / 537.36(" 
              " KHTML、ヤモリ等)クローム/ 79.0.3945.88サファリ/ 537.36 " 
} 

电影主演时间国家评分
DEF FilmInformation(URL):
    コンテンツ = [] 
    R&LT = requests.get(URL、ヘッダー= ヘッダ)
    応答 = r.text 
    スープ = BeautifulSoup(応答、" html.parser " 
    映画 = soup.select(.board品目-main " のためのフィルムフィルム: =(film.select(" タイトル" )[0]の.text) #
         (。film.select名=("名前「)[0]の.text)があってもよいですリターンはのリストであるので、なぜ、ゼロで 
        見つめる=(film.select(".star ")[0]の.text).strip()スプリット(" ")[1]  中文的冒号 
        releasetime =(film.select(" .releasetime ")[0]の.text).split(" ")[1] .split(" " )[0]  =(film.select(" .releasetime ")[0]の.text).split(" ")[1] [10 :]
         もし国: = country.replace(" """).replace("" "" ) lstrip()rstip()等也可以实现
         = " (暂无)" 
        整数 =(film.select(" .integer " )[0]の.text)
        フラクション =(フィルム。 (選択し" .fractionを" )[0]の.text)
        スコア =整数+ 分数
        content.append([名、見つめ、releasetime、国、スコア])
    戻りコンテンツ

デフWriteExcel(データ):
    タイトル = [ " 电影""主演" " 时间" " 国家" " 评分" ] 
    ブック = xlwt.Workbook(コード= " UTF-8 " 
    シート = workbook.add_sheet(" 猫眼前100 "  = 1
      I における範囲(LEN (タイトル)):
        sheet.write(0、I、タイトル[i])と
    するための NUM データ:
          num_num NUM:
            num_numでnum_num_numための:
            のためのCOL における範囲(LEN(num_num)):
                sheet.write(行、列、num_num [COL]) + = 1 
    workbook.save(" maoyan.xls " 

DEF (メイン):
    すべて = []
     のための URL URLを:
        結果 = FilmInformation(URL)
        all.append(結果)
    WriteExcel(すべての)

場合 __name__ == " __main__ " 
    main()の

 

おすすめ

転載: www.cnblogs.com/python-kp/p/12518350.html