Python apache CGI编程:如何解决网页乱码、调用cookie乱码问题?AH01215: UnicodeEncodeError: ‘gbk‘ codec can‘t encode char

1,直接在html代码中添加“charset="text/html;utf-8”。

这个方法,会直接让浏览器使用gbk编码模式。这虽然可以解决网页乱码的问题,但不能根本解决编码问题。如果你后面确定不使用含有中文的一些函数操作,那么你可以使用这个方法,否则不推荐使用。

这里举例说明一下,如下所示:

标号1位置的代码,表面浏览器会采用gbk的编码模式,事实也确实如此。运行后如图所示:

标记2、3位置的代码,就是用获取之前网页设置的cookie。这时候浏览器运行这段脚本的时候就出错了。打开apache24中的log文件,在erro中我们可以看到错误日志,如下图所示:

通过这四个红色框,我们就发现了脚本运行出错的根本原因,最后一个红色框里已经说明了:

AH01215: UnicodeEncodeError: 'gbk' codec can't encode character '\\x8f'

这个错误,说直白一点,就是编码出问题了,网页代码用的是gbk编码,而python脚本用的是utf-8编码,所以在使用print打印时,apache报错了或者直接乱码显示。

那么为了避免这些问题,我推荐大家使用第二个解决网页编码、乱码的方法。

2,python文件中,指明控制台的编码的方式,即添加:

import sys

sys.stdout=codecs.getwriter('utf-8')(sys.stdout.buffer);

这两句代码,类似于java中的输出流套接方法,getwriter(“utf-8”)返回一个streamwritter(‘parameter’)函数,而sys.stdout.buffer就作为参数,供streamwritter(‘parameter’)使用。这样就指明了sys.stdout标准输出流的编码方式为utf。

如此一来,整个网页的编码方式就是’utf’了。如上图所示,添加标记1的代码后,整个网页的编码都是utf-8了,如下图运行所示:

解决了整个网页编码的问题,最后我们还要解决python函数调用cookie时出现的乱码问题。如图标记4所示,我们需要对从cookie中获取的字段值进行编码,最终输出utf-8编码的内容,即采用这段代码:

‘your getting str’.encode(‘latin-1’).decode(‘utf-8’)

这里需要注意一个点:cookie采用latin-1的编码模式,所以我们要用encode将cookie的字段内容按latin-1来解码,最后再utf-8编码成字符串。最终,这个脚本运行结果就正确了!如上面最后一张图所示,这个python文件正确读出了cookie的字段值。

我是科学财子,一个正在学习python的新人程序员,立志从事测试、游戏开发、大数据、AI方向!关注我,不定时为你分享python编程干货!每天进步一小点,每天成长一大步!

猜你喜欢

转载自blog.csdn.net/lili2425960/article/details/116450765