https://baike.baidu.com/item/Unicode
这篇百度百科中讲解了utf8的格式、utf16的格式。
utf8的编码格式:
Unicode编码(十六进制)
|
UTF-8 字节流(二进制)
|
000000-00007F
|
0xxxxxxx
|
000080-0007FF
|
110xxxxx 10xxxxxx
|
000800-00FFFF
|
1110xxxx 10xxxxxx 10xxxxxx
|
010000-10FFFF | 11110xxx 10xxxxxx 10xxxxxx 10xxxxxx |
关于这个之间的转换可以借鉴cjson源码中utf16转换为utf8。