Java 为什么占两个字节的char类型采用utf-8时可以存储中文？ - 代码天地

Java 为什么占两个字节的char类型采用utf-8时可以存储中文？

其他 2020-06-23 11:37:43 阅读次数: 0

Java语言内部存储采用的是Unicode编码，Unicode编码中的每个字符占两个字节，中文也是占两个字节，所以，Java中的字符可以存储一个中文汉字。

1、而在不同的编码方式中，中文所占的字节数是不同的：

① ASCII码中，一个英文字母（不分大小写）占一个字节的空间，一个中文汉字占两个字节的空间。一个二进制数字序列，在计算机中作为一个数字单元，一般为8位二进制数，换算为十进制。最小值0，最大值255。

② UTF-8编码中，一个英文字符等于一个字节，一个中文（含繁体）等于三个字节。

③ Unicode编码中，一个英文等于两个字节，一个中文（含繁体）等于两个字节。

符号：英文标点占一个字节，中文标点占两个字节。举例：英文句号“.”占1个字节的大小，中文句号“。”占2个字节的大小。

④ UTF-16编码中，一个英文字母字符或一个汉字字符存储都需要2个字节（Unicode扩展区的一些汉字存储需要4个字节）。

⑤ UTF-32编码中，世界上任何字符的存储都需要4个字节。

2、解释为什么Java的char类型只占用两个字节，采用utf-8编码时，为什么可以存储汉字？

Unicode是一种字符集（charset），用两个字节就能囊括世界上多有的文字集合。

UTF-8是一种编码方式（encoding），是Unicode的一种表现方式。

在Java文件中如果声明了char c = '中';，编译后生成的class文件会把中转化成Unicode的一种表现方式。

Java char在内存中只会使用Unicode编码，所有其他编码只可能是在转换成byte[]之后才能具体体现。

理解字符集和字符编码的区别，有助于题主理解这些问题

猜你喜欢

转载自blog.csdn.net/weixin_44296929/article/details/106907250

Java 为什么占两个字节的char类型采用utf-8时可以存储中文？

java的char类型，只有两个字节，为什么可以存储汉字？java中 char详解

Java中字符编码问题和中文占几个字节的问题（ASCII Unicode UTF-8 ）

java char 只有两个字节, 怎么装下9万多汉字？

java字符串类型字符将两个字节合并成一个字节

C数据类型-中文为什么两个字节

php中按字节截取字符串方法,(汉字占两个字节，字母占一个字节,页面编码必须为utf-8)

java中char到底占几个字节的问题

关于java中char占几个字节，汉字占几个字节

utf-8的中文，一个字符占几个字节

utf-8的中文是一个字符占几个字节

java中boolean类型占几个字节

java中Boolean类型到底占几个字节？

Java中的boolean类型占几个字节

Java char类型可以存储汉字吗

java两个字符串的比较

utf-8的中文是一个汉字占三个字节长度吗?

oracle utf-8中文占几个字节

【转】utf-8的中文是一个汉字占三个字节长度

UTF-8编码占几个字节?

Java 读取UTF-8文件中文乱码

弄懂进制、bit、java基本数据类型（byte、short、int 、char 、String）、ASCII、Unicode、UTF-8、UTF-16的关联关系及UTF-8、UTF-16编码原理

Java中char占多少字节

Java中char,short,int,long占几个字节和多少位

Java 中 char 和 Unicode、UTF-8、UTF-16、ASCII、GBK 的关系

Java 去除utf-8类型的空格的方法

GBK与UTF-8的中文是一个字符占几个字节

Java中关于char类型的变量为什么可以赋值为整型数字

字符编码 - utf-8的中文是一个汉字占三个字节长度吗？

字符编码史：请问utf-8的中文是一个汉字占三个字节长度吗？

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)