1, una colección de
1.1, la definición de
{} En la pluralidad de elementos separados por una coma, una pluralidad de elementos satisface las siguientes tres condiciones:
<1 se debe establecer dentro del tipo de elemento es inmutable.
<Colección desordenada de elementos 2 dentro.
<3 dentro del conjunto de elementos no se repite.
1,2, la conversión de tipos
res = set ( 'hellolllll') # revoluciones tipo string set de impresión (conjunto ([1,1,1,1,1,1]) ) # conjunto de forma automática re- impresión (conjunto ([1,1,1,1 , 1,1, [11222]]) # error, el tipo de variable está presente en la colección de impresión (conjunto ({ 'k1' : 1 'k2': 2})) # clave conjunto almacenado
1.3, integrado en el método
= {Friends1 "CERO", "Kevin", "Jason", "Egon"} friends2 = { "de Jy", "Ricky", "Jason", "Egon"} en la intersección: amigo común tanto de impresión (friends1 y friends2) Imprimir (friends1.intersection (friends2)) tomadas y del sistema / de la colección: ambos todos los amigos Imprimir (friends2 | friends1) Imprimir (friends1.union (friends2)) para tomar la diferencia de conjuntos: toma amigos1 único amigo de impresión (friends1 -friends2) Imprimir (friends1.difference (friends2)) diferencia simétrica: la suma de dos amigos son únicos para el usuario (es decir, eliminar el amigo común) Imprimir (friends1 ^ friends2) Imprimir (friends1.symmetric_difference (friends2)) y su hijo conjunto: relación incluido s1 = {1,2,3,4} s2 = {l, 2,3} Imprimir (s1> s2) se s1 s2 # Analizando superconjunto se determina de impresión (s1.issuperset (s2)) # s1 s2 superconjunto de impresión (s1 <s2) # s1 es determinado subconjunto s2 s2) Analizar # s1 s2 conjunto de sub impresión (s1.issubset (s2)) # determina un subconjunto de s2 s1 relación # inclusión no existe, son los siguientes False comparativo l, 2,3} = {S1 S2 = {l, 2,3} de impresión (S1 == s2) # S1 y S2 entre sí Sons
Deduplication 1, sólo para el peso para el tipo inmutable de impresión (SET ([1,1,1,1,2])) 2, el orden original no puede garantizar l = [1, 'a' , 'b', ' Z', 1,1,1,2] L = Lista (SET (L)) Imprimir (L)
Otros longitud operativa, el miembro operativo, el ciclo como antes
otra incorporada en el método
s = {1,2,3} en los métodos integrados necesitan saber. 1: descarte (. 4) s.discard para eliminar los elementos ausencia # Nada hacen de impresión (S) s.remove (4). # Eliminar elementos no existe error necesidad de conocer construido método 2: actualización s.update ({l, 3,5}) de impresión (S) POP: necesidad haber 3 incorporado métodos. RES = s.pop () Imprimir (RES) necesidad de han incorporado en los métodos. 4: el Agregar S. Añadir (. 4) Imprimir (S) métodos restantes son todos entiende res = s.isdisjoint parte común ({3,4,5,6}) # set de dos completamente independiente, no hay retorno verdadera impresión (RES) Aprende s.difference_update ({3,4, 5}) = S # s.difference ({3,4, 5}) Imprimir (S)
2, codificación de caracteres
tabla ASCII:
1, sólo es compatible con la cadena de Inglés
2, 8 bits número binario correspondiente a una cadena de Inglés
GBK Tabla:
1, soporta caracteres en inglés, los caracteres chinos
2, 8 bits (8 bits = 1Bytes) número binario correspondiente a una cadena de Inglés
de 16 bits (16 bits = 2 bytes) corresponde a una cadena de número binario chino
Unicode (el uso de memoria unificada Unicode):
1, las naciones de caracteres compatibles
y naciones personaje tiene una relación correspondiente entre el
2, 16 bits (16 bits = 2 bytes) binarias corresponde número en una cadena chino
de raro individuo utilizará 4Bytes, 8Bytes
codificaciones de caracteres antiguos se pueden convertir a Unicode, pero no pueden unicode Huzhuan
UTF-8:
Inglés -> 1Bytes
personajes -> 3Bytes
Conclusión:
1, la retención de la memoria Uso de Unicode, podemos cambiar eso en el disco en un formato de
caracteres chinos Inglés + - "unicode-" GBK
Inglés + japonesa - "unicode-" Shift-JIS
Palais carácter "-unicode-" UTF-8
2, los problemas de acceso a archivos de texto ilegible
existen en estado de agitación: la solución es, el formato de codificación se debe establecer para apoyar la cadena de formato de papel
para tomar el caos: la solución es, ¿qué archivos formatos tales como memoria de disco duro codificado, debe ser ¿Qué formato de codificación se lee en la memoria
3, intérprete de Python lee el valor por defecto de codificación de archivos
por defecto python3:. UTF 8
python2 defecto: ASCII
Especificar el encabezado del archivo para modificar la codificación por defecto:
el archivo py primera línea de escritura:
#coding: GBK
4, para asegurar que las dos fases no son ilegibles regla básica antes de ejecutar el programa de pitón:
especifica el encabezado del archivo de
los archivos de formato de codificación almacenados originalmente en el disco duro que se utiliza: # de codificación
. 5,
a python3 tipo predeterminado de depósito directo en formato str Unicode, en cualquier caso no ser ilegible
garantizar tipo python2 str de distorsión no es
x = u 'on'
6 para
intérprete cadena python2 tiene dos tipos: STR, Unicode
# tipo STR
x = 'on' valor de cadena # especificado por el valor formato de codificación de cabecera almacenado en el espacio de memoria de variables
# tipo Unicode
x = u ' el '# salvó la fuerza como unicode