现在MySQL的字符编码使用最多的是utf8,但是此utf8最多只能存3字节字符,如果遇到像emoji这种四字节字符就无能为力了,保存的时候就会抛出异常:Caused by: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT' at row 1。遇到这个问题,一种解决方案是将此字符类似图片的base64编码一样编码后存储,但是取出来用的时候就必须解码;另外的一种终极解决方案就是,替换字符编码为utf8mb4.
MySQL从 5.5.3+开始,推出了utf8mb4字符编码,就可以支持四字节字符了,还可以完美兼容utf8。utf8mb4就是utf8 most 4 bytes的意思。MySQL数据库支持从库、表、字段分别使用不同的编码,如果想整个数据库支持,那么需要修改配置文件后重启。表和字段可以随意设置编码。
两种字符编码区别见:
https://www.cnblogs.com/beyang/p/7580814.html
配置文件修改编码和表、字段修改编码见:
https://blog.csdn.net/love_zhang_xin/article/details/62223420
https://www.cnblogs.com/patf/p/5148016.html
最终一个很重要的是需要执行一个SQL语句。
set names utf8mb4;
数据库配置文件中可以使用init-sql=set names utf8mb4;
程序中可以给数据源配置 连接初始化SQL:例如Druid数据源:
connectionInitSqls=set names utf8mb4;
修改数据库编码需要特别慎重,稍不注意可能造成无法挽回的损失!!!
下面给一个示例:
https://mathiasbynens.be/notes/mysql-utf8mb4#utf8-to-utf8mb4