MySQL存四字节数据(emoji)

现在MySQL的字符编码使用最多的是utf8,但是此utf8最多只能存3字节字符,如果遇到像emoji这种四字节字符就无能为力了,保存的时候就会抛出异常:Caused by: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT' at row 1。遇到这个问题,一种解决方案是将此字符类似图片的base64编码一样编码后存储,但是取出来用的时候就必须解码;另外的一种终极解决方案就是,替换字符编码为utf8mb4.

MySQL从 5.5.3+开始,推出了utf8mb4字符编码,就可以支持四字节字符了,还可以完美兼容utf8。utf8mb4就是utf8 most 4 bytes的意思。MySQL数据库支持从库、表、字段分别使用不同的编码,如果想整个数据库支持,那么需要修改配置文件后重启。表和字段可以随意设置编码。

两种字符编码区别见:

https://www.cnblogs.com/beyang/p/7580814.html

配置文件修改编码和表、字段修改编码见:

https://blog.csdn.net/love_zhang_xin/article/details/62223420

https://www.cnblogs.com/patf/p/5148016.html

最终一个很重要的是需要执行一个SQL语句。

set names utf8mb4;

数据库配置文件中可以使用init-sql=set names utf8mb4;

程序中可以给数据源配置 连接初始化SQL:例如Druid数据源:

connectionInitSqls=set names utf8mb4;

修改数据库编码需要特别慎重,稍不注意可能造成无法挽回的损失!!!

下面给一个示例:

https://mathiasbynens.be/notes/mysql-utf8mb4#utf8-to-utf8mb4

猜你喜欢

转载自blog.csdn.net/xxssyyyyssxx/article/details/81354774
今日推荐