python基础整理——中文编码初探

   在编写英文以及拼音时,python的程序能够正常的运行,但是在 编写汉字时,如果使用的编辑器没有经过编码处理,可能会报错。为了更好的解决这个问题,我参考菜鸟教程进行了总结:

在window环境下:

Python 文件中如果未指定编码,在执行过程会出现报错:

#!/usr/bin/python

(本语言的第一行,目的就是指出,你想要你的这个文件中的代码用什么可执行程序去运行它)

#!/usr/bin/python是告诉操作系统执行这个脚本的时候,调用/usr/bin下的python解释器。
#!/usr/bin/env python这种用法是为了防止操作系统用户没有将python装在默认的/usr/bin路径里。当系统看到这一行的时候,首先会到env设置里查找python的安装路径,再调用对应路径下的解释器程序完成操作。这种写法会去环境设置寻找python目录,推荐这种写法)

 print "你好,世界";

以上程序执行输出结果为:

 File "test.py", line 2 SyntaxError: Non-ASCII character '\xe4' in file test.py on line 2, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

Python中默认的编码格式是 ASCII 格式,在没修改编码格式时无法正确打印汉字,所以在读取中文时会报错。

解决方法为只要在文件开头加入

  • # -*- coding: UTF-8 -*-
  • 或者 #coding=utf-8 就行了

如果没有此文件编码类型的声明,则 python 默认以ASCII编码去处理;如果你没声明编码,但是文件中又包含非ASCII编码的字符的话,python解析器去解析的 python 文件,自然就会报错了。

在Linux环境下:

在Linux环境中唯一的区别是“\”的区别,需要把windows中的“/”换成“\”字符。

猜你喜欢

转载自my.oschina.net/u/3754854/blog/1622177