部分代码转载自https://zhuanlan.zhihu.com/p/40834093,详细python3编码方式见链接
一、python3
1、首先搞懂本地操作系统编码与系统编码的区别:
(1)本地操作系统编码方式是与操作系统有关的,linux默认的编码方式是utf-8,windos的默认编码方式是gbk
(2)系统编码方式是与编译器有关的,python3编译器的默认编码方式是utf-8,python2编译器的默认编码方式是ascii
2、python3头文件中的#coding='utf-8'的含义:
指定python3的编译器以什么样的编码格式打开。
3、编码方式并不仅仅代表编码,解码也包含其中,两者是相对应的。
示例代码:
import sys, locale
s = "小甲"
print(s)
print(type(s))
print(sys.getdefaultencoding())
print(locale.getdefaultlocale())
with open("utf1","w",encoding = "utf-8") as f:
f.write(s)
with open("gbk1","w",encoding = "gbk") as f:
f.write(s)
with open("jis1","w",encoding = "shift-jis") as f: #shift-jis为日文编码格式
f.write(s)
此时的输出:
小甲
<class ‘str’>
utf-8
(‘en_US’, ‘UTF-8’)
各个文件打开的结果:
utf1:小甲
gbk1:乱码
jis1:乱码
解释:
utf1:python3编译器以utf-8方式编码成二进制码,在写入文件的时候,操作系统为linux,默认的编码方式为utf-8,所以第一个文件的储存为正常的utf-8的编码成为的二进制形式,显示的时候,操作系统以utf-8的格式解码二进制码,所以第一个文件显示正常。
gbk1:python3编译器以utf-8方式编码成二进制码,在写入文件的时候,指定了gbk的格式,所以储存进文件是以gbk格式编码‘小甲’成为二进制文件,操作系统以utf-8的格式解码的时候出现的了错误
jis1:跟gbk1同理
用图来解释更清楚:
小甲------编编辑器储蓄:utf-8编码------->二进制码A--------编译器显示:utf-8解码------->小甲--------写入文件:gbk编码/shift-jis------>二进制码B/C--------utf-8解码---------->错误的乱码