A、リクエストライブラリー
R = requests.gets(URL)がサーバリソース要求オブジェクトへの要求を作成し、応答オブジェクトは、サーバがリソースを返す含ま
requests.get(URL、のparams =なし、** kwargsから)
URL:リンクされたページのURLが取得意図
URLで追加のパラメータ、辞書やバイトストリーム形式、オプション:のparams
** kwargsから:12のアクセス制御パラメータを
実際には、要求()メソッドを呼び出すことにより、7つの一般的に使用される方法は、この方法の背後にある6個実装さの合計を提供するために要求します。
レスポンスは、爬虫類のコンテンツ全体の収益を含み
第二に、Responseオブジェクトのプロパティ
分析:
第三に、異常なリクエストライブラリー
第四に、ライブラリ要求の簡単な使用
最初の小さな爬虫類:
>>>インポート要求
>>> R = requests.get( "http://www.baidu.com")
>>>プリント(r.stauts_code)
200说明成功
>>>タイプ(R)
<クラスのrequests.models.Response '>
>>> r.headers
{...}
>>> r.encoding
>>> R .apparent_encoding
>>> r.encoding = 'UTF-8'
r.encoding:文字セットヘッダが存在しない場合、符号化は、ISO-8859-1(より正確)と考えられる
r.apparent_encoding:分析ページ・コンテンツのエンコーディングを(より正確な)