mysql中文数据字符集问题

版权声明:本文为博主原创文章,转载请注明出处 https://blog.csdn.net/qq_42750240/article/details/90201638

前言:计算机只识别二进制;人类更多是识别符号;

一、插入中文字符失败

mysql客户端向服务器插入中文数据,没有成功,
原因:\xD5\xC5\xD4\xBD代表中文字符在当前编码(字符集)下对应的二进制编码转换成十六进制:一个汉字=两个字节(GBK)
报错: 服务器没有识别对应的字节,服务器认为客户端数据是UTF8格式,一个汉字有三个字节,于是读取三个字节转换成汉字(识别失败)
注意: 所有的数据库服务器认为(表现)的一些特性都是通过服务器端的变量来保存,系统先读取字节的变量看看应该怎么表现。

1、查看服务器所有支持的字符集

show character set;

2、查看服务器默认的对外处理字符集

show variables like 'character_set%';

变量说明:
character_set_client(设置客户端使用的字符集)
character_set_connection(设置连接数据库时的字符集)
character_set_database(设置默认创建数据库的编码格式)
character_set_filesystem(文件系统的编码格式)
character_set_results(数据库给客户端返回的数据编码格式)
character_set_server(服务器安装时指定的默认编码格式)
character_set_system(数据库系统的编码格式)
character_sets_dir(字符集安装目录)

3、修改服务器认为的客户端数据的字符集为GBK

set character_set_client = gbk;

4、成功插入数据

二、插入数据内容乱码

原因: 数据来源是服务器,解析数据是客户端(客户端只识别GBK,只会两个字节一个汉字),但事实服务器给的数据却是UTF8(三个字节一个汉字),最终导致乱码。
解决方案: 修改服务器给客户端展示的字符集为GBK

set character_set_results = gbk;

最后:利用set的修改只是会话级别(当次连接有效);有个快捷设置统一编码的语法set names gbk;含义就是将character_set_client,character_set_results,character_set_connection;都设置为gbk的编码格式

猜你喜欢

转载自blog.csdn.net/qq_42750240/article/details/90201638