一,问题描述
评论系统中,用户输入Emoji表情符号时,保存用户评论时后台数据库报错。错误描述如下:
Caused by: java.sql.SQLException: Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...' for column 'CONTENT'
二,问题原因
普通的字符串或者表情都是占位3个字节,所以utf8足够用了,但是移动端的表情符号占位是4个字节,普通的utf8就不够用了,为了应对无线互联网的机遇和挑战、避免 emoji 表情符号带来的问题、涉及无线相关的 MySQL 数据库建议都提前采用 utf8mb4 字符集,这必须要作为移动互联网行业的一个技术选型的要点。对于Incorrect string value: '\xF0\x9F\x98\x97\xF0\x9F...'的问题,多数都是因为字符集原因导致的,以前从latain改成gbk,从gbk改成utf8,而CONTENT字段已经是utf8了,那么比utf8更多的就只有utf8mb4了,修改该字段类型字符编码为utf8mb4即可。
ps:需要 >= MySQL 5.5.3版本、从库也必须是5.5的了、低版本不支持这个字符集、复制会报错。
三,解决方案
可以单独修改用户评论表中的CONTENT字段字符集为utf8mb4(使用navicat mysql客户端)
示例图如下:
参考文档: