中文乱码 mysql数据库latin1 乱码 latin1 转 UTF-8 - 代码天地

中文乱码 mysql数据库latin1 乱码 latin1 转 UTF-8

数据库 2018-05-10 08:59:02 阅读次数: 1

同步数据库，从A数据库（编码为latin1）取出数据，数据为 åˆ˜å¹¿å·ž ，传到B数据库（编码为UTF8），同步过程中 java 对 åˆ˜å¹¿å·ž 数据转成UTF8，以让其中文正常显示。

Mysql 的latin1 不等于标准的latin1（iso-8859-1）和cp1252,比iso-8859-1多了0x80-0x9f字符，比cp1252多了0x81,0x8d,0x8f,0x90,0x9d 一共5个字符。

这样在Java中，如果使用标准的iso-8859-1或者cp1252解码可能出现乱码。
s.getBytes("iso-8859-1") 或者 s.getBytes("cp1252"); 所以用以下方法解决。

public String convertCharset(String s)
    {
        if (s != null)
        {
            try
            {
                int length = s.length();
                byte[] buffer = new byte[length];
                //0x81 to Unicode 0x0081, 0x8d to 0x008d, 0x8f to 0x008f, 0x90 to 0x0090, and 0x9d to 0x009d.
                for (int i = 0; i < length; ++i)
                {
                    char c = s.charAt(i);
                    if (c == 0x0081)
                    {
                        buffer[i] = (byte) 0x81;
                    }
                    else if (c == 0x008d)
                    {
                        buffer[i] = (byte) 0x8d;
                    }
                    else if (c == 0x008f)
                    {
                        buffer[i] = (byte) 0x8f;
                    }
                    else if (c == 0x0090)
                    {
                        buffer[i] = (byte) 0x90;
                    }
                    else if (c == 0x009d)
                    {
                        buffer[i] = (byte) 0x9d;
                    }
                    else
                    {
                        buffer[i] = Character.toString(c).getBytes("CP1252")[0];
                    }
                }
                String result = new String(buffer, "UTF-8");
                return result;
            }
            catch (UnsupportedEncodingException e)
            {
                e.printStackTrace();
            }
        }
        return null;
    }

http://dev.mysql.com/doc/refman/5.0/en/charset-we-sets.html
http://www.oschina.net/question/2795_74288

猜你喜欢

转载自qi20088.iteye.com/blog/2240351

中文乱码 mysql数据库latin1 乱码 latin1 转 UTF-8

mysql中文乱码latin1转utf8

乱码 latin1 转 UTF-8

MySQL数据库解决乱码 latin1 转 gbk

mysql latin1乱码

MySQL latin1 编码转 utf-8 格式

latin1转gbk的乱码问题，jdbc的bug

PHPnow 数据库编码 Latin1转换UTF－8

mysql 乱码字符 latin1 characters 转换为 UTF8

mysql中latin1编码中文转utf8

MySQL字符集设置及字符转换（latin1转utf8）

MySQL字符集LATIN1转UTF8

转换包含UTF8和latin1等多种编码的MYSQL数据库

Tomcat中ISO-8859-1转UTF-8中文乱码的问题

[MySQL]数据库原理2，Server，DataBase，Connection，latin1、UTF-8，gb2312，Encoding，Default Collation——喵喵期末不挂科

ASCII，Latin1，Unicode，UTF-8与GBK编码的区别

mysql51如何修改latin1编码为utf8?

不同子系统采用不同MySQL编码LATIN1和UTF8的兼容

MySQL8.0.17默认字符集latin1改utf8

python json.dumps()中文乱码UnicodeEncodeError: 'latin-1' codec can't encode characters in position 18-24: Body ('x') is not valid Latin-1. Use body.encode('utf-8') if you want to send it encoded in UTF-8.

理解并解决GBK转UTF-8奇数中文乱码

HTML5 UTF-8 中文乱码（转）

utf-8转成GBK 中文乱码

QT乱码总结1.Unicode 和 UTF-8

new String(getBytes(ISO-8859-1),UTF-8)中文编码避免乱码

MySQL在DOS界面下中文UTF-8乱码问题

Server characterset和Db characterset从latin1设置为utf8

更改Mysql5.7的默认编码为utf8解决database为latin1无法修改问题

爬取网页数据出现中文乱码 UTF-8中文乱码

GBK转UTF-8乱码，为什么不可逆

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)