2.1字符编码相关知识点简介 - 代码天地

2.1字符编码相关知识点简介

其他 2018-08-19 12:14:00 阅读次数: 0

unicode码：只是规定了什么数值表示什么字符；仅定义了一个映射表，没有具体的编码，如何存储字符就是编码。

1.有多种方式可以表示unicode码。

测试：abc中保存为下面四种方式。

ascii码：中国大陆默认是GB2312。

utf-8：EF BB BF 最常用的编码方式。前三个字节表示utf-8编码。

utf-16le；FF FE

utf-16be: FE FF

2.为什么有多种方式来表示unicode码？

因为会造成字节浪费。

3.utf-8简要讲解。

最大的特点：它是一种变长的编码方式，可以使用1~4个字节来表示一个符号；根据不同的字符而改变字节的长度。

1）

对于单字节而言：字节的第一位设为0，其余7位是字符的unicode码。

对于英文字母：和ascii码相同。

2）对于n（n>1）字节的符号，前n为设为1，n+1为设为0；后面字节前两位设为10，剩下未提及到的都是unico码。

可以写一个简单的测试代码测试"abc中",同时保存为ascci和utf-8格式

注意：linux下测试需要对变量进行初始化为0；

测试发现：直接编译运行后ascci的编码不对。

为何？

因为默认是以utf-8解析的。

如何解决？

man gcc

搜索 /charset

得出编译时需要制定输入输出字符集，默认是utf-8解析的。

-finput-char=charset -fexec-charset=charset

输入字符集输出字符集（程序执行是以什么编码执行的）

猜你喜欢

转载自blog.csdn.net/qq_34738528/article/details/77608498

2.1字符编码相关知识点简介

2.1/2.2字符的编码方式及显示

2.1列表相关知识点

代码基础知识-5字符和编码

Java中运算符相关知识点

相关知识点

01字符编码

[知识点] 2.1 枚举与模拟

js字符串相关知识点

js截取字符串相关的知识点

字符串相关类知识点总结

MongoDB相关知识点

oracle相关知识点

http 相关知识点

java相关知识点

日期相关知识点

servlet相关知识点

css相关知识点

JVM相关知识点

linux相关知识点

mysql 相关知识点

redis相关知识点

Hibernate相关知识点

STL相关知识点

FGC相关知识点

ajax相关知识点

MFC相关知识点

Filter相关知识点

实体相关知识点

String 的相关知识点

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)