一些关于编码的问题 - 代码天地

一些关于编码的问题

其他 2020-02-10 16:07:46 阅读次数: 0

ASCII

（American Standard Code for Information Interchange）编码不能表示汉字中文

GB2312

GB2312 是对 ASCII 的中文扩展。

GBK

GB2312的基础上扩展，增加了近20000个新的汉字（包括繁体字）和符号。

GB18030

GBK的基础上扩展，又加了几千个新的少数民族的字。

UNICODE

ISO（国际标谁化组织）制订。统一包含所有国家的编码。是一种字符集，不属于编码。

UTF-8

解决unicode在互联网的传输问题，每次8个位传输数据，是unicode的一种实现方式。
为传输而设计的编码，并使编码无国界，这样就可以显示全世界上所有文化的字符了。

提示：

windows cmd 窗口下不支持utf-8，想要显示中文必须转换为gbk或者unicode。
在 Python idle 和 cmd 下直接输入 s = "中文"会以 gbk 编码的。
而 Python idle 中这三种编码都支持。
中文乱码的出现都是由于编码不一致导致的，存储的是用utf-8，打印的时候用gbk就会乱码了，所有要保证不乱码尽量保持统一，建议全部使用unicode。

设置编码

import sys
reload(sys) 
sys.setdefaultencoding('utf-8')

不同编码之间不能直接转化，先转换为unicode。
raw_input提示字符串只能为gbk编码

chardet 可以查看字符串编码格式。

>>> import chardet
>>> chardet.detect('abc123')
{'confidence': 1.0, 'encoding': 'ascii'}
>>> chardet.detect('中国')
{'confidence': 0.7525, 'encoding': 'utf-8'}

发布了7 篇原创文章 · 获赞 0 · 访问量 1137

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43199103/article/details/89575420

一些关于编码的问题

关于在SSM中遇到的一些编码问题

关于 Java 编码中的一些细节问题

关于Agile的一些问题

关于Redis的一些问题

关于VMware一些奇怪的问题

关于类的一些问题

关于pytest的一些问题

Android 关于一些焦点的问题

关于FIFO的一些问题

关于ExpandableListView的一些问题。

关于异常的一些问题

一些关于scala的基础问题

关于HashMap的一些问题

关于Genymotionmotion的一些问题

关于缓存问题的一些思考

关于SQL的一些优化问题

关于IDEA的一些问题

关于SVM的一些问题

一些关于IO流的问题

关于SOA的一些概念问题

关于一些问题的考虑

关于DOM的一些基础问题

关于指针的一些问题

关于vuecli的一些问题

关于 Dubbo 的一些经典问题

关于maven的一些问题

关于Map的一些问题

关于List的一些问题

关于mysql的一些问题

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)