python:汉字编码

汉字编码

国标系列:

    GB18030 (二字节或四字节编码, 共27533个字)

    GBK (二字节编码, 共21003个字)

    GB2312 (二字节编码,共6763个汉字) (Windows常用)

国际标准:

     UNICODE <---> UTF-8 (Linux / Mac OS X / IOS / Android 等常用)

python编码字符串:

       'gb2312'    'gbk'        'gb18030'          'utf-8'          'ascii' ...

      以上字符串用于encode和 decode中

编码注释:

    在python源文件的第一行或第二行写入如下内容:

      # -*- coding:gbk -*-                  # 设置源文件编码格式为gbk

      或 # -*- coding:utf-8 -*-         # 设置源文件编码格式为utf-8

       作用: 告诉解释执行器,此前文件的编码是什么

猜你喜欢

转载自www.cnblogs.com/longyuu/p/12961137.html