Baiduのポストバー爬虫類アプレットのソースコード

_ * _コーディング::#UTF_8 _ * _ 
インポートurllib.request 
インポートurllib.parse 
インポートOSの
URL = ' http://tieba.baidu.com/f?' 
スタート = INT(INPUT(" 開始ページ番号を入力してください" ))
終了 = INT(入力(" 終了ページ番号を入力してください:" )) =入力(" 検索バーに添付の名前を入力してください:" 
NAME1 = urllib.parse.quote(名)
NUM1 =([スタート] - 1)* 50 
NUM2 =(END- 。1)* 50 
IFないos.path.exists(名前):
    パス = R ' E:\パイソン' 
    os.mkdir(パス + 名)
 用の I における範囲(開始、終了):
    データ = {
     ' KW ' :NAME1、
     ' すなわち'' UTF-8 ' ' PN ' :I、
    } 
    ヘッダー = {
     ' のUser-Agent '' のMozilla / 5.0(Windows NTの10.0; Win64の、のx64)のAppleWebKit / 537.36(ヤモリ様KHTML)クローム/ 75.0.3770.100サファリ/537.36' 
    } 
    データ = urllib.parse.urlencode(データ)
    のURL + = データ
    要求 = urllib.request.Request(URL = URL、ヘッダー= ヘッダ)
    応答 = urllib.request.urlopen(リクエスト)
    ファイル名 =名+ ' _ ' + STR (I)+ " の.html " 
    ファイルパス =パス+名+ ' / ' + ファイル名を
    開く(ファイルパス、' WB 'としてFP:
        fp.write(response.read())
        プリント("{N}ダウンロードページの完了 .format(= N-I))

 

おすすめ

転載: www.cnblogs.com/ybl20000418/p/11609596.html