初识python: 字符编码转换

指定当前文件编码格式:#-*- coding:utf-8 -*-
unicode(万国码): 英文字母 1个字节,中文3个字节
python中所有的字符都是unicode编码
所有非unicode编码互转都需要先转换成unicode:
  unicode encode --> utf-8/gbk
  utf-8/gbk decode --> unicode


实例:
#!/user/bin env python
# author:Simple-Sir
# time:20180922
#指定当前文件编码格式化:#-*- coding:utf-8 -*-
# unicode(万国码): 英文字母 1个字节,中文3个字节
#打印系统默认编码
import sys
print(sys.getdefaultencoding())
# unicode encode --> utf-8/gbk
# utf-8/gbk decode --> unicode
# 将utf-8转成gbk
s = '你好' #python中所有的字符都是unicode编码,所以,此处s是unicode编码
#unicode转gbk
s_to_gbk = s.encode('gbk')
print('unicode转gbk:',s_to_gbk)
#gbk转unicode
gbk_to_unicode = s_to_gbk.decode('gbk')
print('gbk转unicode:',gbk_to_unicode)
#unicode转utf-8
gbk_to_utf8 = gbk_to_unicode.encode('utf-8')
print('gbk转utf8:',gbk_to_utf8)

猜你喜欢

转载自www.cnblogs.com/simple-li/p/9690752.html