python3编码方式问题

部分代码转载自https://zhuanlan.zhihu.com/p/40834093,详细python3编码方式见链接

一、python3

1、首先搞懂本地操作系统编码与系统编码的区别:

(1)本地操作系统编码方式是与操作系统有关的,linux默认的编码方式是utf-8,windos的默认编码方式是gbk

(2)系统编码方式是与编译器有关的,python3编译器的默认编码方式是utf-8,python2编译器的默认编码方式是ascii

2、python3头文件中的#coding='utf-8'的含义:

 指定python3的编译器以什么样的编码格式打开。
 
 3、编码方式并不仅仅代表编码,解码也包含其中,两者是相对应的。

示例代码:

import sys, locale

s = "小甲"
print(s)
print(type(s))
print(sys.getdefaultencoding())
print(locale.getdefaultlocale())

with open("utf1","w",encoding = "utf-8") as f:
    f.write(s)
with open("gbk1","w",encoding = "gbk") as f:
    f.write(s)
with open("jis1","w",encoding = "shift-jis") as f:    #shift-jis为日文编码格式
    f.write(s)

此时的输出:

小甲
<class ‘str’>
utf-8
(‘en_US’, ‘UTF-8’)

各个文件打开的结果:
utf1:小甲
gbk1:乱码
jis1:乱码
解释:

utf1:python3编译器以utf-8方式编码成二进制码,在写入文件的时候,操作系统为linux,默认的编码方式为utf-8,所以第一个文件的储存为正常的utf-8的编码成为的二进制形式,显示的时候,操作系统以utf-8的格式解码二进制码,所以第一个文件显示正常。
gbk1:python3编译器以utf-8方式编码成二进制码,在写入文件的时候,指定了gbk的格式,所以储存进文件是以gbk格式编码‘小甲’成为二进制文件,操作系统以utf-8的格式解码的时候出现的了错误
jis1:跟gbk1同理

用图来解释更清楚:
小甲------编编辑器储蓄:utf-8编码------->二进制码A--------编译器显示:utf-8解码------->小甲--------写入文件:gbk编码/shift-jis------>二进制码B/C--------utf-8解码---------->错误的乱码

猜你喜欢

转载自blog.csdn.net/weixin_43310928/article/details/85079796
今日推荐