utf8和字节数组的转换 - 代码天地

utf8和字节数组的转换

其他 2020-04-18 10:17:28 阅读次数: 0

ps：int转byte只会取低八位
如228的二进制是前面一堆0，然后11100100
转为byte就变成11100100，补码就是-128+64+32+4 = -28
Stream相关类传输时候，返回的是int，传输可能是byte数组。注意

    System.out.println(Arrays.toString("中".getBytes()));
    //[-28, -72, -83]

utf8转换工具会得到&#x4E2D;

基础知识：
unicode转换为utf-8编码的规则
Unicode         UTF-8
0000-007F      0xxxxxxx
0080-07FF     110xxxxx 10xxxxxx
0800-FFFF    1110xxxx 10xxxxxx 10xxxxxx

如果字符对应编码值小于0x7F，则转换该为1个byte，最高位为0
（0x7F转换为二进制为111111，7个1。不会出现最高位为1，最高位为1肯定大于7F。），该字符对应的二进制替换X，不足7位前面高位加0

编码值在0080到07FF字符，会转换为2个字节，并且第一个字节以110开头，第二个字节以10开头，字符对应的编码值转换为2进制后的数据，填充X。不足位数的高位加0

编码值在0800到FFFF字符，会转换为3个字节，并且第一个字节以1110开头，后面字节以10开头，字符对应的编码值转换为2进制后的数据，填充X。不足位数的高位加0

也就是说大于07XX编码值的字符，转换为字节时，第一个字节中连续1的个数表示该字符对应字节的长度

转换过程

“中”的unicode通过查unicode编码表可知为：4E2D，
通过转换为二进制：100 1110 0010 1101。
4E2D落在了0800~ FFFF区间内，再依据前面转换规则填充x。
100 111000 101101

11100100 10111000 10101101
然后按补码
11100100 = -128+64+32+4 = -28
10111000 = -128+32+16+8 = -72
10101101 = -128+32+8+4+1 = -83

复习一下补码（按8位）
28的二进制是00011100
那么反码就是11100011
补码就是11100100

猜你喜欢

转载自www.cnblogs.com/islch/p/12724282.html

utf8和字节数组的转换

中英文分别在utf8和GBK中所占字节数

C#基础 Encoding GetString 字节数组转UTF8编码的字符串

js实现unicode码字符串与utf8字节数据互转

C#基础 Encoding GetBytes 字符串转换为UTF-8编码的字节数组

Notepad++查看文本文件的总的字符数、GBK字节数、UTF8字节数

golang实现整型和字节数组之间的转换

文件转换为字节数组

java中判断字节数组的编码方式是不是UTF-8

utf-8等编码方式汉字和英文各占据的字节数

UTF-8编码方式汉字和英文各占据的字节数

java String与包装类和字节数组、字符数组间的转换

C语言字节数组和hex和互相转换

python之字节串和字节数组

Python字节串和字节数组

16进制字符串和字节数组互相转换

C# 中字符串string和字节数组byte[]的相互转换

VB 字节数组和字符串的转换问题 (String<>Byte)

VB 长整型和字节数组的转换问题 (Long<>Byte)

C# 中字符串string和字节数组byte[]的转换

Java之字节数组和字符串的转换问题

【C#】字符串string和字节数组byte[]的转换

Python 字节数组和 16进制字符串转换

C#: 字符串string和字节数组byte[]的转换

C#-----字节数组(byte[])和字符串相互转换

字符串和字节数组的转换的字符集

字节数组和short,int,float,double等类型的相互转换

加密后字节数组和字符串相互转换

Java字符串和字节数组的相互转换

java中对象与字节数组相互转换

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)