基础篇-字符编码 - 代码天地

基础篇-字符编码

其他 2019-10-21 00:34:06 阅读次数: 0

经常出现文档显示乱码，探究一下背后的原因。

ASCII
最早计算机发明的时候只用显示英文加一些符号，一个字节就够用了，这就是ASCII码，规定了一个字节范围类字符与二进制数值之间的映射关系，在终端下执行man ascii，即可看到下表。比如字符A对应的值是65二进制(01000001)。

GB2312，GBK，GB18030
单个字节最多只能表示256个字符，这就表示不了汉字了，于是出现了双字节字符集，用两个字节表示一个汉字。GB2312是上世纪80年代出现的，主要收录简体汉字和符号；90年代出现GBK，扩展了繁体字等；2000年后出现了GB18030，收录了少数民族文字。GB字符集是向前兼容的。

Unicode
GB字符集解决了汉字显示的问题，但没有解决在一个文档中同时显示多种文字的问题，如同时在一个文档中显示中文与日文，Unicode字符集就是为了解决这个问题而出现的。它收录了人类所有的字符，每个字符都有一个唯一的二进制编码，这就解决了在同一份文档中显示所有文字的问题。

UTF-8
Unicode只规定了字符的编码，但并没有规定这些编码怎么存储，有的字符对应15个比特位，有的字符则对应30个比特位。于是出现了多种编码方式，如UTF-8，UTF-16，UTF-32，其中UTF-8是一种变长编码方式，最能节省空间，已成为Unicode编码方式的事实标准。

总结
GB编码与Unicode是不同的字符编码集，它们之间毫无关系。文档出现乱码就是读取文档时使用的编码方式与文档实际存储的编码方式不一致导致的。

猜你喜欢

转载自www.cnblogs.com/progyoung/p/11711101.html

基础篇-字符编码

python 基础字符编码

python 基础字符编码

python基础——字符编码

python基础--字符编码

python基础字符编码

Python基础-字符编码

字符编码基础（一）

python基础 & 字符编码

java基础字符编码

Python基础篇(is和==,编码)

python基础之字符编码

python基础语法---字符编码

Python基础-字符编码与转码

Python基础之字符编码！

python 基础二字符编码

python基础字符编码转换

【Java 基础】28 字符编码

第一篇2：python基础之字符编码

字符编码---进阶编程篇（六）

第六篇.字符编码

编程必备基础知识|计算机组成原理篇(06)：计算机的字符与编码集

计算机基础 —— 字符、字符集、字符编码

java安全编码指南之:基础篇

java安全编码指南之：基础篇

Python基础四：字符串及编码

python基础---不同字符编码的转换

py基础（字符串和编码）

python基础知识之字符编码

Python 基础系列--字符串与编码

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)