Pythonの文字エンコーディングおよびトランスコーディング

  

詳細な記事:

http://www.cnblogs.com/yuanchenqi/articles/5956943.html

http://www.diveintopython3.net/strings.html

注意:

1. python2のデフォルトエンコーディングはASCIIで、デフォルトでのpython3はUnicodeです

2.unicode(4バイト)、UTF-16(2バイト)、UTF-8(1-4バイトを表す)UTF-32を分割するので、UTF-16は、現在最も一般的にはユニコードでありますバージョンは、しかし、スペースがUTF8ので保存し、ファイルまたはUTF8に保存します

バイトに同時にPY3エンコード3.また、トランスコーディング・タイプ文字列、文字列をバイトバックデコードしながらデコード

 

 図は、唯一PY2に適用されます

# - * -コーディング:UTF-8 - * - 
__author__ = 'アレックスリー' 

インポートSYSの
プリント(sys.getdefaultencoding())


MSG = "我爱北京天安门" 
。msg_gb2312 = msg.decode( "UTF-8")エンコード( "2312")
gb2312_to_gbk = msg_gb2312.decode( "GBK")。( "GBK")をコード

印刷(MSG)
プリント(msg_gb2312)
プリント(gb2312_to_gbk)を

python2で

  

# - * -コーディング:UTF-8 - * - 
__author__ = 'アレックスリー' 

インポートSYSの
プリント(sys.getdefaultencoding())


MSG = "我爱北京天安门" 
。msg_gb2312 = msg.decode( "UTF-8")エンコード( "2312")
gb2312_to_gbk = msg_gb2312.decode( "GBK")。( "GBK")をコード

印刷(MSG)
プリント(msg_gb2312)
プリント(gb2312_to_gbk)を

python2で

  

おすすめ

転載: www.cnblogs.com/wjcoding/p/10991091.html