爬虫類の学習の目的は何でしょうか?
私の現在の理解は、爬虫類で、大量のデータへのアクセスを取得し、例えば、私は周りの住宅価格の変化を分析したい、その後、私は定期的に不動産のウェブサイトに関連する最新の住宅価格データをクロールする必要があります。
次のコードを見てください
包要求の#importインポート要求 URL = 'http://www.baidu.com' RESP = requests.get(URL) プリント(それぞれ)#返回<応答[200]>
それが白の場合、以下の質問を有することができます
何1. URLこと?
2. requests.get(URL)これは何が起こったかのステップ?
3.戻り<応答[200]>とは何ですか?
私は、我々はこの本を「ネットワークは、接続されているか」を参照してくださいすることをお勧めのPythonの切れがあることが必要だと思います
何1. URLこと?
URLは、ブラウザ、そのURLにユーザーが入力しました。「のHttp:」デフォルトはindex.htmlにある、特定のファイルにアクセスするためにここでは省略し、Webサーバー名www.baidu.comにアクセスするために必要とされている「www.baidu.com」、Webサーバにアクセスするために使用するHTTPプロトコルを表し、
2. requests.get(URL)これは何が起こったかのステップ?
ターゲットへのアクセス(ユーザーが客観的にアクセスすることを望んでいるかを知るために、URLを解析することによっては、例えば、Baiduの絵の一つです)、必要なもののアクション(私たちは、一般的方法を取得し、投稿するの知覚:HTTPリクエストメッセージは、2つの要素を必要と生成)
メッセージ送信要求の一連の処理をスキップし、応答メッセージを得ることが......
3.戻り<応答[200]>とは何ですか?
200は、要求が成功したことを示すステータスコードであり、要求または応答ヘッダ所望のデータ量は、応答リターンに応じて変化します。