IO corriente de codificación de caracteres

En casi todos los lenguajes de programación son todo lo que hay problemas de codificación de caracteres, los componentes básicos de un ordenador es sólo 0,1 dos números, los números con el fin de permitir que los dos equipos se pueden describir más de contenido de información por lo que sólo diversos expresión lógica bit, mientras que si es para mostrar el texto, entonces el personaje debe ser codificado en un ordenador, se utiliza en el código ASCII principios de la codificación, pero esto puede ser descrito como sustancialmente codificado pertenece al carácter básico, y más tarde, los caracteres chinos en realidad encontrar que necesita un mayor alcance de codificación para poder describir, por lo que este análisis es una forma de evitar el proceso de codificación se realiza china

Vamos a guardar un programa de otra manera, al utilizar javac y java comando para ejecutar el programa, los resultados se quejan, se trata de nuestros problemas de codificación
en el transcurso de sólo escribir programas Java, que, en el caso de no prestar atención a carácter problema de codificación, Windows dentro de la línea de comandos por defecto sólo es compatible con la codificación GBK, otra codificación no es compatible, incluso si el código del programa es correcta, pero debido al proceso de codificación es incorrecta, por lo que el programa definitivo todavía no se puede ejecutar
en día términos reales entre el proceso de desarrollo, los tipos más comunes de los niños que codifican tipos son
 JDS / GB2312: Descripción de codificación china GB, que puede ser descrito GBK chino simplificado y tradicional china Hugh Hugh y chino simplificado GB2312 justo;
ISO8859-1: codificación internacional universal , cualquier texto se puede describir, pero para algunas de las necesidades gráficas de texto para hacer transcodificación;
l UNICODE: una codificación hexadecimal, se puede describir una variedad de información de texto en el mundo, incluyendo múltiples de un solo byte o bytes, pero hay un problema, no todas las palabras son tan largas para codificar, por ejemplo: Alfabeto, no hay ningún uso de esta manera si el ancho de banda ocupado por significado codificada (perder el ancho de banda)
l · UTF codificación: puede entenderse simplemente como "ISO8859-1 + Unicode" (combinar las ventajas), utilizarlo cuando se necesita la longitud de hexadecimal hex-codificada, si no se utiliza en la forma de ISO8859-1, esta codificación es más adecuado para la transmisión de la red, y las especificaciones comunes es "UIF8" codificación

Después de tanto tiempo como las herramientas de desarrollo de código de programación, entonces debemos primero de todas las herramientas de desarrollo de soporte de codificación para reemplazar toda la codificación UTF-8, y si es para codificar correctamente la configuración, es necesario conocer el sistema actual ¿Cuál es la codificación por defecto de tipo.

package com.sicau.demo;
public class CharacterEncoding {

    public static void main(String[] args) {
        System.getProperties().list(System.out);

    }
}

file.separator = file.encoding = UTF-8 (obtenido por medio IDEA)
la file.encoding = GBK (Obtener herramienta de línea de comandos, ventanas de línea de comandos siguientes razones codificación UTF-8 es que no puede ser utilizado aquí)

De hecho, ahora claramente definida de codificación después, puede ser muy buena explicación del problema ilegible, esencia ilegible es que: los datos codificados y decodificar los datos no es uniforme.

package com.sicau.demo;
import java.io.*;
public class CharacterEncoding {

    public static void main(String[] args) throws IOException {
        // System.getProperties().list(System.out);
        File file = new File("G:" + File.separator + "message.txt");
        OutputStream output = new FileOutputStream(file);

        String message = "这是乱码的测试学习";
        byte[] data = message.getBytes();
        output.write(data);
    }

}

Ahora el programa es capaz de realizar la visualización normal, normal de
este tiempo hablando de la cadena en una matriz de bytes no usar otra codificación, por lo que pertenecía a la codificación predeterminada, por lo que si el sistema es compatible con nuestra codificación predeterminada y, a continuación, de forma natural, para obtener los datos correctos

Ejemplo: Obligatorio nuestro contenido de salida en otra es decir, codificada contenido de la salida de codificación (formato que hemos desarrollado, nos ocupamos de la producción en la plataforma Windows no es ilegible

package com.sicau.demo;
import java.io.*;
public class CharacterEncoding {

    public static void main(String[] args) throws IOException {
        // System.getProperties().list(System.out);
        File file = new File("G:" + File.separator + "message.txt");
        OutputStream output = new FileOutputStream(file);

        String message = "这是乱码的测试学习";
        byte[] data = message.getBytes("ISO8859-1");
        output.write(data);
    }
}

Las operaciones generales actuales no soportan dicha información de codificación a, por lo que el contenido no puede ser en última instancia obtuvo el proceso de codificación correcta, lo que resulta en la generación de basura.

Supongo que te gusta

Origin www.cnblogs.com/zrcblog/p/12526662.html
Recomendado
Clasificación