Pythonのクローラーは、シリアル9-JSザ・「塩」、AJAXリクエストを暗号化

A、「塩」のJSの暗号化

1.saltプロパティ「塩」:そのような私たちの銀行カードのパスワードとして、暗号のために使用さは6ですが、銀行システムにおける事実の後、我々はパスワードを入力し、元のパスワードをクラックするより困難形成するために、いくつかの文字を追加しますパスワード。このプロセスは、私たちが呼ぶ「塩。」

 

"" " 

处理JS加密

""" 

インポート時、ランダム


デフgetSalt():

     ""」

    塩公式: "" +((新日).getTime()+のparseInt(10 * Matn.rnandom()、10) )

    :リターン

    ""」
 = INT(time.time()* 1000)+ random.randint(0,10 


    の戻り


デフgetMD5():

    インポートhashlib 

    md5zhi = hashlib.md5()
    md5zhi.update (v.encoding

 = " UFT-8 " 

    記号 = md5zhi。hexdigest() 


    の戻り記号

もし __name__ == " __main__ " 

    getSalt()

getMD5()

 

二、AJAXリクエスト

1.非同期要求。

2.そこURLます、リクエストメソッドは、あなたがデータを持っていること

3.フォーマットが一般に使用されるJSON

4.ケース:IMDBのクロール

 

"" " 

爬取豆瓣电影排行榜

""" 

から urllibはインポート要求

輸入JSON 

URL = " https://movie.douban.com/typerank?type_name=%E5%89%A7%E6%83%85&type=11&interval_id= 100:90&ACTION = " 

RSP = request.urlopen(URL)

データ = rsp.read()デコード()。
データ

 = json.loads(データ)

、印刷(データ)

アクセスへのブラウザを装った抗クレソン爬虫類のメカニズムがあるので、我々は、Pythonのコードを変更するここで間違った報告書、

 

"" " 

爬取豆瓣电影排行榜

""" 

から urllibはインポート要求

インポートJSON 

url_u = " https://movie.douban.com/typerank?type_name=%E5%89%A7%E6%83%85&type=11&interval_id= 100:90&ACTION = " 

ヘッダー = { 

    " ユーザエージェント"" はMozilla / 5.0(Windows NTの10.0; WOW64)のAppleWebKit / 537.36(ヤモリ様KHTML)クローム/ 80.0.3987.116サファリ/ 537.36 " 

} 

URL = request.Request( url_u、ヘッダー= ヘッダ)

RSP = request.urlopen(URL)

データ = rsp.read()。デコード()


印刷(データ)

第三に、ソース

Reptitle9_1_JSEncryption.py

Reptitle9_2_ajaxResponse.py

https://github.com/ruigege66/PythonReptile/blob/master/Reptitle8_1_JSEncryption.py

https://github.com/ruigege66/PythonReptile/blob/master/Reptitle9_2_ajaxResponse.py

2.CSDNます。https://blog.csdn.net/weixin_44630050

3.パークブログます。https://www.cnblogs.com/ruigege0000/

4.歓迎マイクロチャンネル公衆数に焦点を当て:フーリエ変換材料を学ぶビッグデータを取得するために、唯一の交流を学ぶために、舞台裏の返信「贈り物」をパブリック個人番号を変換

 

 

おすすめ

転載: www.cnblogs.com/ruigege0000/p/12343908.html