Introducción a Python Semana Día 04 (el conjunto y la codificación de caracteres)

1, una colección de

 1.1, la definición de

{} En la pluralidad de elementos separados por una coma, una pluralidad de elementos satisface las siguientes tres condiciones:
    <1 se debe establecer dentro del tipo de elemento es inmutable.
    <Colección desordenada de elementos 2 dentro.
    <3 dentro del conjunto de elementos no se repite.

 

1,2, la conversión de tipos

res = set ( 'hellolllll') # revoluciones tipo string set 
de impresión (conjunto ([1,1,1,1,1,1]) ) # conjunto de forma automática re- 
impresión (conjunto ([1,1,1,1 , 1,1, [11222]]) # error, el tipo de variable está presente en la colección 
de impresión (conjunto ({ 'k1' : 1 'k2': 2})) # clave conjunto almacenado

1.3, integrado en el método

= {Friends1 "CERO", "Kevin", "Jason", "Egon"} 
friends2 = { "de Jy", "Ricky", "Jason", "Egon"} 
en la intersección: amigo común tanto 
de impresión (friends1 y friends2) 
Imprimir (friends1.intersection (friends2)) 
tomadas y del sistema / de la colección: ambos todos los amigos 
Imprimir (friends2 | friends1) 
Imprimir (friends1.union (friends2)) 
para tomar la diferencia de conjuntos: toma amigos1 único amigo 
de impresión (friends1 -friends2) 
Imprimir (friends1.difference (friends2)) 
diferencia simétrica: la suma de dos amigos son únicos para el usuario (es decir, eliminar el amigo común) 
Imprimir (friends1 ^ friends2) 
Imprimir (friends1.symmetric_difference (friends2)) 

y su hijo conjunto: relación incluido 
s1 = {1,2,3,4} 
s2 = {l, 2,3} 
Imprimir (s1> s2) se s1 s2 # Analizando superconjunto 
se determina de impresión (s1.issuperset (s2)) # s1 s2 superconjunto 
de impresión (s1 <s2) # s1 es determinado subconjunto s2 s2) Analizar # s1 s2 conjunto de sub 
impresión (s1.issubset (s2)) # determina un subconjunto de s2 s1
relación # inclusión no existe, son los siguientes False comparativo

l, 2,3} = {S1 
S2 = {l, 2,3} 
de impresión (S1 == s2) # S1 y S2 entre sí Sons
Deduplication 
1, sólo para el peso para el tipo inmutable 
de impresión (SET ([1,1,1,1,2])) 

2, el orden original no puede garantizar 
l = [1, 'a' , 'b', ' Z', 1,1,1,2] 
L = Lista (SET (L)) 
Imprimir (L)  
Otros longitud operativa, el miembro operativo, el ciclo como antes 

otra incorporada en el método
s = {1,2,3} 
en los métodos integrados necesitan saber. 1: descarte 
(. 4) s.discard para eliminar los elementos ausencia # Nada hacen 
de impresión (S) 
s.remove (4). # Eliminar elementos no existe error 


necesidad de conocer construido método 2: actualización 
s.update ({l, 3,5}) 
de impresión (S) 

POP: necesidad haber 3 incorporado métodos. 
RES = s.pop () 
Imprimir (RES) 

necesidad de han incorporado en los métodos. 4: el Agregar 
S. Añadir (. 4) 
Imprimir (S) 



métodos restantes son todos entiende 
res = s.isdisjoint parte común ({3,4,5,6}) # set de dos completamente independiente, no hay retorno verdadera 
impresión (RES) 

Aprende 
s.difference_update ({3,4, 5}) = S # s.difference ({3,4, 5}) 
Imprimir (S)

2, codificación de caracteres

tabla ASCII:
1, sólo es compatible con la cadena de Inglés
2, 8 bits número binario correspondiente a una cadena de Inglés

GBK Tabla:
1, soporta caracteres en inglés, los caracteres chinos
2, 8 bits (8 bits = 1Bytes) número binario correspondiente a una cadena de Inglés
de 16 bits (16 bits = 2 bytes) corresponde a una cadena de número binario chino

Unicode (el uso de memoria unificada Unicode):
1, las naciones de caracteres compatibles
      y naciones personaje tiene una relación correspondiente entre el
2, 16 bits (16 bits = 2 bytes) binarias corresponde número en una cadena chino
      de raro individuo utilizará 4Bytes, 8Bytes

 

codificaciones de caracteres antiguos se pueden convertir a Unicode, pero no pueden unicode Huzhuan

 

UTF-8:
  Inglés -> 1Bytes
  personajes -> 3Bytes

Conclusión:
1, la retención de la memoria Uso de Unicode, podemos cambiar eso en el disco en un formato de
caracteres chinos Inglés + - "unicode-" GBK
Inglés + japonesa - "unicode-" Shift-JIS
Palais carácter "-unicode-" UTF-8

2, los problemas de acceso a archivos de texto ilegible
existen en estado de agitación: la solución es, el formato de codificación se debe establecer para apoyar la cadena de formato de papel
para tomar el caos: la solución es, ¿qué archivos formatos tales como memoria de disco duro codificado, debe ser ¿Qué formato de codificación se lee en la memoria


3, intérprete de Python lee el valor por defecto de codificación de archivos
por defecto python3:. UTF 8
python2 defecto: ASCII

Especificar el encabezado del archivo para modificar la codificación por defecto:
el archivo py primera línea de escritura:
#coding: GBK

4, para asegurar que las dos fases no son ilegibles regla básica antes de ejecutar el programa de pitón:
especifica el encabezado del archivo de
los archivos de formato de codificación almacenados originalmente en el disco duro que se utiliza: # de codificación


. 5,
a python3 tipo predeterminado de depósito directo en formato str Unicode, en cualquier caso no ser ilegible
garantizar tipo python2 str de distorsión no es
x = u 'on'


6 para
intérprete cadena python2 tiene dos tipos: STR, Unicode
# tipo STR
x = 'on' valor de cadena # especificado por el valor formato de codificación de cabecera almacenado en el espacio de memoria de variables
# tipo Unicode
x = u ' el '# salvó la fuerza como unicode

  

 

  

Supongo que te gusta

Origin www.cnblogs.com/BoyGc/p/12470765.html
Recomendado
Clasificación