python中文乱码问题汇总 - 代码天地

python中文乱码问题汇总

企业开发 2018-05-10 09:19:55 阅读次数: 0

将python2中汉字会出现乱码的事一次性说清楚。
为了让初学者，不再为python2中汉字出现乱码的事烦恼！

请看迪艾姆公司python培训上课老师黄哥细细道来：
1、写的代码模块需要指定编码
如果代码没有指定coding,python就默认所有的字符为ASCII码,
ASCII码只支持256个字符,ASCII码不支持中文,所以就报错。
所以要在代码前写上#coding:utf-8或#coding:gbk
但通用写上#coding:utf-8

2、python2内部所有编码统一为unicode
unicode可以处理世界上所有语言的字符。
utf-8为unicode的一种实现形式，所以需要在代码前写上#coding:utf-8

3、编码转换
牢记python2内部编码为unicode.
其它的编码decode()为unicode,再编码encode()为你指定的编码,就不会出现乱码。

4、网页采集时
代码指定#coding:utf-8
如果网页的编码为gbk
需要这样处理：
html = html.decode('gbk').encode('utf-8')

5、代码前也可以写#coding:gbk,但也要保证你的代码文件的保存格式为gbk.这个在windos下会出现这样的问题。

6、字典等key或值的汉字问题
#coding:utf-8
dict1 ={1:'python周末培训班',2:'咨询010-68165761 QQ：1465376564'}

print dict1
# 这样输出的没有显示汉字，是显示汉字的其它编码

dict2 ={1:'python视频培训班',2:'咨询010-68165761 QQ：1465376564'}
for key in dict2:
print dict2[key]

7、unicode的汉字编码写到文本文件中
需要根据文本文件的编码进行转换
可以encode('utf-8')或encode('gbk')

总结：凡是报错信息中出现的错误包含“ASCII”，就是没有指定汉字编码的问题。

----获取字符串的编码类型----------------------------------------------------------------
>>> date = urllib2.urlopen("http://www.baidu.com")
>>> d = date.read()
>>> import chardet
>>> chardet.detect(d)
{'confidence': 0.99, 'encoding': 'utf-8'}

猜你喜欢

转载自jacklin2015.iteye.com/blog/2288619

python中文乱码问题汇总

Python中文乱码问题

Python 中文乱码问题

[python] 中文乱码问题

python输出中文乱码的问题

Python中文乱码问题（转）

python中文编码乱码问题

python 输出中文乱码的问题

Python pymongo 中文乱码问题

python中文乱码问题(爬虫)

Python控制台中文乱码，终端中文乱码问题

Python中的编码问题，中文乱码问题

php中文乱码问题的终极解决方案汇总

jsp/tomcat/数据库中文后乱码问题汇总

彻底搞懂 python 中文乱码问题

python中文乱码问题大总结

处理Python2.7的中文乱码问题

python中requests库中文乱码问题

python生成csv中文乱码的问题

selenium+python解决中文乱码问题

Sublime解决Python运行中文乱码问题

Python 3.6.5解决中文乱码问题

window下python中文乱码问题

python 中文乱码问题深入分析

python在终端上中文乱码问题的小结

在editplus编辑python中文乱码问题

python使用zipfile解压中文乱码问题

Python 关于 encode与decode 中文乱码问题

python json串中文乱码问题

Python操作中出现中文乱码等问题

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)