リクエストの後にゴミ問題を解決するには2つの方法があります。
:バイナリデータを取得し、その後、トランスコーディングstrを使用
URL = ' http://music.baidu.com ' R = requests.get(URL) HTML = r.content html_doc = STR(HTML、' UTF-8 ')#html_doc = html.decode( "UTF-8" 、) "無視" プリント(html_doc)
2:使用r.text
要求は、自動的にサーバからコンテンツをデコードします。ほとんどのUnicode文字セットをシームレスに復号することができます。要求が行われた後、リクエストは、符号化されたHTTPレスポンスヘッダに基づいて推測を行います。あなたがr.textにアクセスすると、要求は、その推定されるテキストエンコーディングを使用します。あなたは、エンコーディング要求を使用するかを知ることができ、そしてそれを変更するには、プロパティをr.encoding使用することができます。
しかし、ライブラリ自体は要求をコード化されていますr.encoding =「ISO-8859-1」
コーディングr.encodingを変更することができます
URL = ' http://music.baidu.com ' R = requests.get(URL) r.encoding = ' UTF-8 ' プリント(r.text)
記事参照:https://www.cnblogs.com/liuliu-word/p/9910197.html
***************短いステップ千マイル***************