python基础整理——中文编码初探

在编写英文以及拼音时，python的程序能够正常的运行，但是在编写汉字时，如果使用的编辑器没有经过编码处理，可能会报错。为了更好的解决这个问题，我参考菜鸟教程进行了总结：

在window环境下：

Python 文件中如果未指定编码，在执行过程会出现报错：

#!/usr/bin/python

（本语言的第一行，目的就是指出，你想要你的这个文件中的代码用什么可执行程序去运行它）

#!/usr/bin/python是告诉操作系统执行这个脚本的时候，调用/usr/bin下的python解释器。
#!/usr/bin/env python这种用法是为了防止操作系统用户没有将python装在默认的/usr/bin路径里。当系统看到这一行的时候，首先会到env设置里查找python的安装路径，再调用对应路径下的解释器程序完成操作。这种写法会去环境设置寻找python目录,推荐这种写法）

 print "你好，世界";

以上程序执行输出结果为：

 File "test.py", line 2 SyntaxError: Non-ASCII character '\xe4' in file test.py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Python中默认的编码格式是 ASCII 格式，在没修改编码格式时无法正确打印汉字，所以在读取中文时会报错。

解决方法为只要在文件开头加入

# -*- coding: UTF-8 -*-
或者 #coding=utf-8 就行了

如果没有此文件编码类型的声明，则 python 默认以ASCII编码去处理；如果你没声明编码，但是文件中又包含非ASCII编码的字符的话，python解析器去解析的 python 文件，自然就会报错了。

在Linux环境下：

在Linux环境中唯一的区别是“\”的区别，需要把windows中的“/”换成“\”字符。

python基础整理——中文编码初探

猜你喜欢