Python chardet Modul

Glücklicherweise aus dem Web einige Inhalte greifen 

jedoch ein Druck ist nicht so jubelnd, und ein paar diesen sehen: 

b ' \ XC8 \ xcb \ XC9 \ RFA \ XBF \ xe0 \ XB6 \ die XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' 
was ist das? Und x und c ist! 

Made in, oh, erwies sich als eine hexadezimale Zeichenfolge von Bytes (Bytes) zu sein, \ x hexadezimal Als 

nächstes werden Sie wollen in der Lage sein , in die menschliche Sprache zu lesen, dachte Decodierung: 

ein In [ 3]: b ' \ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' .decode ()
 ---------------- -------------------------------------------------- --------- 
ein UnicodeDecodeError Traceback (Last Call Letztes MOST)
 <IPython-INPUT-3-7d0ea6148880> in <Module1> 
---->. 1 B '\ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' .decode () 

a UnicodeDecodeError: ' UTF- 8. ' CODEC CAN ' T in decode Byteposition 0 0xC8 : ungültige Fortsetzung Byte 
sofort, warf ein Topf mit kaltem Wasser den Kopf gegossen, Anomalie. . . . . 

Bei Aufforderung UnicodeDecodeError, die Unicode Fehler decodiert. 

Original, dekodieren die Standard - Codierverfahren: UTF -8 

daher ausgeschlossen B ' \ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' mit UTF-8 - codierten Art und Weise 

, dies ist jedoch nicht von vier multiple-Choice - ah, eins nach dem anderen falsch auszuschließen! 

Dutzende von Codierung, kann sie nicht eins nach dem anderen ausgeschlossen werden. 

Dann denke , es ist ! ! ! ! ! ! ! ! ! ! ! ! ! 

Das Leben ist kurz, ich Python verwendet 

Python, konnte ich nicht , dass Sie auch beteiligt lassen tragen - 

versuchen , drei Zeilen Code , um das Problem zu lösen , 

den ersten Schritt, die Installation chardet es ist eine Abkürzung für char erkennen.

Der zweite Schritt, pip installieren chardet 

dritten Schritt, wobei das Ergebnis 

der In [ 6.]: Chardet.detect (B ' \ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' ) 
Out [ 6.]: { ' kodiert ' : ' GB2312 ' ' Vertrauen ' : 0,99, ' Sprache ' : ' Chinese ' } 
kodiert Methode: gb2312 

Bytes entschlüsselt string: 

die In [ . 7]: B ' \ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' .decode ( ' GB2312 ')
OUT [7]: ‚ Das Leben ist kurz, habe ich Python 

 

Ich denke du magst

Origin www.cnblogs.com/miaoweiye/p/12619279.html
Empfohlen
Rangfolge