pitón Chardet módulo

Felizmente, agarrar un poco el contenido de la Web 

, sin embargo, una impresión no es tan jubilosa, y ver un montón de esto: 

b ' \ XC8 \ xcb \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ del XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' 
¿qué es esto? Y X y C es! 

Hecho en, oh, que resultó ser una cadena hexadecimal de octetos (bytes), \ x hexadecimal 

A continuación, tendrá que ser capaz de leer en el lenguaje humano, el pensamiento de decodificación: 

una en [ 3]: b ' \ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' .decode ()
 ---------------- -------------------------------------------------- --------- 
un UnicodeDecodeError Rastreo (Última llamada recientes más)
 <IPython-ENTRADA-3-7d0ea6148880> en <Módulo1> 
---->. 1 B '\ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' .decode () 

un UnicodeDecodeError: ' UTF-8. ' CODEC CAN ' T en decodificar posición de byte 0 0xC8 : byte continuación no válido 
inmediatamente, una olla de agua fría vertida la cabeza, lanzando anomalía. . . . . 

Cuando se indique, UnicodeDecodeError, que es Unicode error de decodificación. 

Original, decodificar el método de codificación por defecto: UTF -8 

por lo tanto excluidos B ' \ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' usando UTF-8 codificada camino 

, sin embargo, esto no es de cada cuatro ah opción múltiple, uno por uno para excluir incorrecto! 

Decenas de codificación, no se puede descartar una por una. 

Entonces supongo que! ! ! ! ! ! ! ! ! ! ! ! ! 

La vida es corta, he usado Python 

Python, no podía soportar que usted involucrado demasiado - 

tratar tres líneas de código para resolver el problema 

el primer paso, la instalación Chardet es una abreviatura de carbón detectar.

El segundo paso, pip instalar Chardet 

tercera etapa, el resultado de 

la En [ 6].: Chardet.detect (B ' \ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' ) 
de salida [ 6].: { ' codificar ' : ' GB2312 ' ' confianza ' : 0,99, ' idioma ' : ' chino ' } 
el método de codificación: gb2312 

bytes descifrado cadena: 

la A [ . 7]: B ' \ XC8 \ XCB \ XC9 \ XFA \ XBF \ xe0 \ XB6 \ XCC \ XA3 \ XAC \ XCE \ XD2 \ XD3 \ xc3Python ' .decode ( ' GB2312 ')
OUT [ 7]: ' La vida es corta, que utiliza Python '

 

Supongo que te gusta

Origin www.cnblogs.com/miaoweiye/p/12619279.html
Recomendado
Clasificación