Pythonの爬虫類(6)クッキー

クッキーとは何ですか

Webサイトの後、HTTPリクエストは、第一およびサーバ接続(通常はステートレスであり、ログインし、その後、サーバはどのユーザーを知っているが、ときにサーバーへの2番目の要求、サーバはまだ現在要求されているユーザーを知りませんユーザが第2のサーバを要求した場合)、クッキーは、この問題を解決することで、最初のログイン・サーバの後、サーバーがブラウザにだけ、ユーザ(すなわちクッキー)に関連付けられたデータを返し、ブラウザのクッキーは、ローカルに保存されます最後に保存されたクッキーは、自動的にサーバーに運ばれる時、クッキーを通してあなたは、現在あるユーザーを知っているだろう。限られたデータストレージ、異なるブラウザのストレージサイズをcookiede。4キロバイトより一般的ではありません。

あなたが閲覧することができます前に、いくつかの爬虫類では、我々は皆と同じように、私たちはすべてのネットワークのための大鵬のホームページを閲覧したいページを入力する前に署名する必要があり、我々は最初のとき爬虫類、どのようにして、ログインを登録する必要があります滞在はそれに署名しましたか?

私たちは、リクエストヘッダにクッキーを追加する必要があります。

[表示要素を - - 私たちは、ページ上で右クリックし、次にネットワーク - リフレッシュが最初の選択選択してクッキーのプロフィール - を見つけます

 

 

 

 我々のコード要求ヘッダーのクッキーに置か外

ログインしたままにするためにクッキーを使用する方法
から urllibはインポート要求
dapeng_url = ' http://www.renren.com/880151247/profile ' 

ヘッダ = {
     ' のUser-Agent '" ;のAppleWebKit / 537.36のMozilla / 5.0(WOW64のWindows NT 10.0) (KHTML、ヤモリなど)クローム/ 63.0.3239.132サファリ/ 537.36 " ' クッキー'"anonymid = k71toeni-kgxl6w。ICK = 15da19e2-eda3-436b-bbff-75e5ed22675a。トン= 2e83d3955db7ebed31b7aa451ce1fc3e6。societyguester = 2e83d3955db7ebed31b7aa451ce1fc3e6。ID = 973827756。xnsid = 83d505c7。XNESSESSIONID = 96f6169a931b。JSESSIONID = abcnUOS-mxGHLfAakl8bx。depovince = GW。jebecookies = 06d125d2-feee-42d3-b3dd-c2d44c83ca52 |||||。= 7.0版。loginfrom = NULL; taihe_bi_sdk_uid = e1ab093fade1d5f67bb87b09690c33ec。taihe_bi_sdk_session = b22cdcce97f748cdd571ae2dd15f35c0。jebe_key = 3f1e8e5f-c442-44f0-913c-b5724bf5f271%7C92df3a4ff360db67ebedb3fcbe322fc1%7C1582631331810%7C1%7C1582631331959。jebe_key = 3f1e8e5f-c442-44f0-913c-b5724bf5f271%7C92df3a4ff360db67ebedb3fcbe322fc1%7C1582631331810%7C1%7C1582631331961。wp_fold = 0 " 
} 
REQ = request.Request(URL = dapeng_url、ヘッダー= ヘッダ)
RESP =request.urlopen(REQ)
 プリント(resp.read()。デコード(' UTF-8 '))

ログを保持しながら、大鵬我々はホームページを入力することができます

 

おすすめ

転載: www.cnblogs.com/zhaoxinhui/p/12363622.html