O que é um conjunto de caracteres? Conjunto de caracteres Unicode e conjunto de caracteres ASCII

Conjunto de caracteres (Conjunto de caracteres) é uma coleção de vários caracteres. Existem muitos tipos de conjuntos de caracteres. Cada conjunto de caracteres contém diferentes números de caracteres. Os conjuntos de caracteres comuns incluem conjunto de caracteres ASCII, conjunto de caracteres GBK e conjunto de caracteres Unicode (UTF-8). espere. Vamos apresentá-lo em detalhes.

Conjunto de caracteres ASCII:

ASCII (Código Padrão Americano para Intercâmbio de Informações, Código Padrão Americano para Intercâmbio de Informações): inclui números, inglês e símbolos. ASCII usa 1 byte para armazenar um caractere, e um byte tem 8 bits, o que pode representar um total de informações de 128 caracteres, o que é suficiente para representar inglês e números.

GBK:

GBK é a tabela de códigos da China, que contém dezenas de milhares de caracteres chineses e outros caracteres, e também é compatível com a codificação ASCII.Um caractere chinês na codificação GBK é geralmente armazenado na forma de dois bytes. Após a codificação UTF-8, o chinês geralmente é armazenado na forma de três bytes e também deve ser compatível com a tabela de codificação ASCII. Todos os técnicos devem usar a codificação do conjunto de caracteres UTF-8.

Conjunto de caracteres Unicode:

Unicode, também conhecido como Unicode. É um padrão da indústria no campo da ciência da computação. UTF-8 é um método de codificação comum de Unicode. O conjunto de caracteres usado na decodificação de caracteres deve ser consistente com o conjunto de caracteres usado na codificação, caso contrário, caracteres distorcidos aparecerão.

Por exemplo, o processo de armazenamento e exibição de caracteres chineses é analisado da seguinte forma:

Nota: Inglês e números não serão distorcidos na codificação de nenhum país.

Você pode escolher o construtor da classe String para codificação e decodificação usando um programa. O método específico é o seguinte:

Codificação de string

Decodificação de string

1691476126260_decodificação.png

Acho que você gosta

Origin blog.csdn.net/Blue92120/article/details/132445003
Recomendado
Clasificación