utf-8编码下，一个字符最多占几个字节?

编程语言 2022-09-26 21:34:25 阅读次数: 0

在UTF-8编码中：一个中文等于三个字节，中文标点占三个字节。

一个英文字符等于一个字节，英文标点占一个字节。

Unicode编码：一个英文等于两个字节，一个中文（含繁体）等于两个字节。中文标点占两个字节，英文标点。

UTF-8使用1~4字节为每个字符编码：

1，一个US-ASCIl字符只需1字节编码（Unicode范围由U+0000~U+007F）。

2，带有变音符号的拉丁文、希腊文、西里尔字母、亚美尼亚语、希伯来文、阿拉伯文、叙利亚文等字母则需要2字节编码（Unicode范围由U+0080~U+07FF）。

3，其他语言的字符（包括中日韩文字、东南亚文字、中东文字等）包含了大部分常用字，使用3字节编码。

4，其他极少使用的语言字符使用4字节编码。

转载自blog.csdn.net/weixin_45525272/article/details/127062586

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)