ゴミ問題を要請

リクエストの後にゴミ問題を解決するには2つの方法があります。

:バイナリデータを取得し、その後、トランスコーディングstrを使用

URL = ' http://music.baidu.com ' 
R = requests.get(URL)
HTML = r.content 
html_doc = STR(HTML、' UTF-8 'html_doc = html.decode( "UTF-8" 、) "無視" 
プリント(html_doc)

2:使用r.text
要求は、自動的にサーバからコンテンツをデコードします。ほとんどのUnicode文字セットをシームレスに復号することができます。要求が行われた後、リクエストは、符号化されたHTTPレスポンスヘッダに基づいて推測を行います。あなたがr.textにアクセスすると、要求は、その推定されるテキストエンコーディングを使用します。あなたは、エンコーディング要求を使用するかを知ることができ、そしてそれを変更するには、プロパティをr.encoding使用することができます。
しかし、ライブラリ自体は要求をコード化されていますr.encoding =「ISO-8859-1」
コーディングr.encodingを変更することができます

URL = ' http://music.baidu.com ' 
R = requests.get(URL)
r.encoding = ' UTF-8 ' 
プリント(r.text)

 

記事参照:https://www.cnblogs.com/liuliu-word/p/9910197.html

***************短いステップ千マイル***************

おすすめ

転載: www.cnblogs.com/liangxiyang/p/11781481.html