外部ライブラリのPythonライブラリの要求は、いくつかの単語の男、そして直接ドライブにそれを行います!
最初は、ライブラリリクエストをインストールすることで、それは単純に言っていません。
ファイル、リクエストライブラリーの導入:
インポート要求
簡単な例を見てみましょう:
#最も簡単な爬虫類小さなプログラムの一つは、ちょうどHTMLソースファイルの最後に取得します
リクエストのインポート
URL1 = "https://live.500.com/" ISO-8859-1#
URL2 = "https://www.baidu.com/" ISO-8859-1#の
URL3 =「HTTPS://研究.163.com /コース、/ introduction.htm?courseId#= 1209448892 / courseDetail?タブ= 1 "#のUTF-8
URL4 =" http://www.cwl.gov.cn/kjxx/ssq/kjgg/「#ISO -8859-1
= requests.get(URL3)再
re.status_codeの== 200 IF:要求が成功した場合#は、それはステータスコードが200で返します。
#は、要求が成功したことを、あなたは下に行くために継続できることを示します
が文字化けすることができる#印刷(re.text)#エンコーディング問題のため、
#プリント(re.encoding)#GET-8文字エンコーディングまたはISO-UTF 8859-1
IF再。エンコーディング==「ISO-8859-1」: #これがコーディングされている場合、それは文字セット2312である必要があり、我々はコードについてオンにする必要があり、そうでない場合は中国の文字化けがあるだろう
HTML = re.text.encode(「ISO-8859-1 ").decode(" GBK「) #は、 最初に符号化し、次に復号
他:
HTML =再。
印刷(HTML)
他:#要求に失敗しました。
印刷(「アクセスが失敗し、別のURLバーを試してみてください!」)
#_________________________________________________________________________________________
re.text#は文字型を返す
re.content#はこの絵の種類、ああ、ああ、サウンド、ビデオなどのために、バイト型を返します
上記の例では、ライブラリを発行したGET要求を要求され、POST要求を送信することができる:
再= requests.post(URL3、データ= {「キー」:「値」})#にパラメータ用辞書。
次のようにいくつかのhttpリクエストがあります。
再=の要求。置く('http://www.baidu.com' 、データ= { 'キー' :'値' })再= 要求します。削除('baidu.com' )再= 要求。ヘッド('www.baidu.com' )再= 要求。オプション('http://www.sina.com.cn' )
未完待续...