GBK转UTF8学习笔记 - 代码天地

GBK转UTF8学习笔记

编程语言 2018-05-12 08:36:07 阅读次数: 3

UTF-8（8-bit Unicode Transformation Format）是一种针对Unicode的可变长度字符编码，又称万国码如果UNICODE字符由2个字节表示，则编码成UTF-8很可能需要3个字节。而如果UNICODE字符由4个字节表示，则编码成UTF-8可能需要6个字节。用4个或6个字节去编码一个UNICODE字符可能太多了，但很少会遇到那样的UNICODE字符

Byte 1	Byte 2	Byte3
0xxxxxxx
110xxxxx	10xx xxxx
1110xxxx	10xx xxxx	10xx xxxx

//单字节字符 1个字节的UTF-8十六进制编码一定是以比8小的数字开头的

//双字节字符 2个字节的UTF-8十六进制编码一定是以C或D开头的

//三字节字符 3个字节的UTF-8十六进制编码一定是以E开头的

// utf-8\u4E00-\u9FFF，这个包含了常用的汉字、日文和韩文

// GBK 8140至FEFE

GBK中文是由2个字节16位组成

转UTF-8时，变成3个字节

Byte 1	Byte 2	Byte3
1110+前4位	10+后6位	10+最后6位

部分代码如下

// 第一个这字放4位，第二个字节放6位，第三个字节放6位
b[0] = (byte) (0xe0 | (m >> 12));
b[1] = (byte) (0x80 | ((m >> 6) & 0x3f));
b[2] = (byte) (0x80 | (m & 0x3f));
return new String(b, "UTF-8")

这样就可以将GBK中文转成utf-8了，当然实际转换过程中还要考虑英文数字等其它字符的问题。

猜你喜欢

转载自yxjajl.iteye.com/blog/2326481

GBK转UTF8学习笔记

gbk转utf8 乱码问题

go 语言GBK 转UTF8

Java实现GBK转UTF8

golang GBK转utf8的方法

GBK与UTF8互转

PHP 汉字转拼音 gbk utf8

小程序字节转GBK及UTF8

go语言中文乱码gbk转UTF8

UTF-8 GBK UTF8 GB2312 之间的区别和关系（转）

Unicode,GBK和UTF8

字符格式（gbk utf8等）

字符截取支持UTF8/GBK

Python文件编码---gbk OR utf8

GBK 和 UTF8编码

gbk和utf8的json转化

linux gbk utf8 文本互转

node.js实现编码转GBK转UTF8，中文乱码方案！！！

UniCode转UTF8

discuz全新安装升级，导入旧数据过程，顺便gbk转utf8

nodejs 读取文件中文乱码 utf8转gbk解决办法

go通过第三方库 mahonia gbk 转utf8

golang 字符串编码转换 gbk转utf8

织梦gbk转utf8(数据库篇)

mysql 学习笔记-改编码为utf8

基础面试之utf8和gbk区别

批量把文件编码由GBK转为UTF8

批量修改GBK到UTF8文件

UNICODE与UTF8和GBK之间的关系

MyEclipse 默认编码是GBK，都修改成UTF8

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)