質問のページをクロールする際に中国のコーディングソリューションの出現が文字化け

 

ウェブサイトのコーディングはUTF-8ですが、そこに文字化けされている参照してください、感じ確かに中国のUTF-8エンコード形式を使用していません

 

インポート要求

 

R = requests.get( 'http://www.baidu.com/')

印刷(タイプ(R))#<クラスのrequests.models.Response '>

印刷(r.encoding)#ISO-8859-1

プリント(r.apparent_encoding)#のGB2312のr.apparent_encodingは、コードの内容を解析することによってです

印刷((r.text.encode(r.encoding).decode(r.apparent_encoding)))#ハッシュコードを返しますではありません

 

おすすめ

転載: www.cnblogs.com/trunkslisa/p/10945153.html