为什么MYSQL要设定用UTF8MB4编码 - 代码天地

为什么MYSQL要设定用UTF8MB4编码

其他 2018-12-23 10:50:54 阅读次数: 0

utf8与utf8mb4具有相同存储特性：相同的代码值，相同的编码，相同的长度。不过utf8mb4扩展到一个字符最多可有4位元，所以能支持更多的位元集。utf8mb4不只兼容utf8，还能比utf8能展示更新的字符。将编码改为utf8mb4外不需要做其他转换。

为了要跟国际接轨，原本的utf8编码在存储某些国家的文字(或是罕见字)已经不敷使用，因此在mysql5.5.3版以上，可以开始使用4-Byte UTF-8 Unicode的编码方式。

Mysql查看版本方式：select version();

Mysql在5.5.3版本之后增加了utf8mb4字符编码，mb4即most bytes 4。简单说utf8mb4是utf8的超集并完全兼容utf8，能够用四个字元存储更多的字符。

utf8跟utf8mb4具有相同的的存储特性：相同的代码值，相同的编码，相同的长度。
不过使用utf8mb4可以让1字符最多可用4位元，所以能支持更多的位元素。
utf8mb4可以向下兼容utf8，而且比utf8可以表示更多的字符。此外，将编码改为utf8mb4不需要其他转换。

utf8已经能够存下大部分中文字，那为什么还要改成使用utf8mb4呢？
原因为mysql支持的utf8编码最大长度为位元(Unicode字符是0Xffff)称之Unicode的基本多文本平面(BMP),但如果遇到4位元的宽字符就会插入异常了，也就是任何不在基本多文本平面的Unicode字符，都无法使用Mysql的utf8字符集存储。

如果要开发讨论区或是国际网页，为了拥有更多的文字兼容行，就可以使用utf8mb4。然而，在CHAR类型数据，utf8mb4会比utf8多消耗一些空间，Mysql官方指出，可使用VARCHAR代替CHAR。

最后，到底使用utf8mb4_general_ci还是utf8mb4_unicode_ci呢？

建议使用：utf8mb4_unicode_ci

这两种排序规则都是为UTF-8字符编码。

utf8mb4_unicode_ci使用标准的Unicode Collation Algorithm(UCA)，utf8mb4_general_ci比utf8mb4_unicode_ci速度要来的快，但是utf8mb4_unicode_ci比utf8mb4_general_ci要来的精确。像是"ß",若是以utf8mb4_general_ci运作，会转成"s",而utf8mb4_unicode_ci则是会转成"ss"。

utf8mb4_general_ci V.S. utf8mb4_unicode_ci

utf8mb4 兼容 utf8，且比 utf8 能表示更多的字串， utf8mb4_unicode_ci 在對文字排序上會比 utf8mb4_general_ci 更精準，utf8mb4_general_ci 是一種簡易化的排序規則，這個規則會把一些相似文字的定義成同一層排序，所以文字排序上無法像 utf8mb4_unicode_ci 這麼精準。因此 utf8mb4_unicode_ci 比較精準。

例如有一些拉丁字母 "ÀÁÅåāă" ，在 utf8mb4_general_ci 的排序規則下，是等同於英文字母 "A"。而 utf8mb4_unicode_ci 還有區分 A, a, À, å。

效能
utf8mb4_general_ci 的效能會比 utf8mb4_unicode_ci 好一些，不過影響的效能很小，很難感受出差別，除非真的很在意這種微小的效能差異，否則建議直接使用 utf8mb4_unicode_ci 就可以了。

https://mathiasbynens.be/notes/mysql-utf8mb4#character-sets

猜你喜欢

转载自blog.csdn.net/rchm8519/article/details/80207165

为什么MYSQL要设定用UTF8MB4编码

MySQL utf8mb4编码

MySQL编码格式更改为utf8mb4

修改MySQL编码为utf8mb4

mysql数据库编码utf8mb4

MYSQL设置utf8mb4编码

Mysql JDBC支持utf8mb4编码

python用mysql建表的UTF8MB3、UTF8MB4警告

mysql utf8mb4

mysql使用utf8mb4

mysql : utf8mb4 的问题

mysql编码方式： utf8和utf8mb4区别

mysql中的编码方式utf8与utf8mb4

MySQL 编码：utf8 与 utf8mb4，utf8mb4_unicode_ci 与 utf8mb4_general_ci

mysql utf8改utf8mb4

mysql,utf8,utf8mb4

MySQL中utf8 && utf8mb4

MySQL——utf8与utf8mb4

既然utf8能兼容绝大部分的字符，为什么要扩展utf8mb4

mysql数据库怎么存入emoji表情，更改utf8mb4后为什么出现全是问号

utf8mb4

MySQL - 更改 MySQL 数据库的编码为 UTF8MB4

微信昵称乱码及mysql编码格式设置（utf8mb4）

微信nickname乱码及mysql编码格式设置（utf8mb4）

Windows Mysql 导入utf8mb4编码sql文件出错问题

更改MySQL数据库的编码为utf8mb4

Windows Mysql 导入utf8mb4编码sql报错

[转]更改MySQL数据库的编码为utf8mb4

mysql设置utf8mb4字符编码

微信nickname乱码（emoji）及mysql编码格式设置（utf8mb4）解决的过程

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)