(十一)字符编码

什么是字符编码?

将人类的字符转化成计算机能够识别的数字0 1 ,字符编码就是一个由字符转成数字的标准。

字符编码表:

  • ASCII: 只有英文还有键盘上所有的符号转化成数字的标准

    1英文字符=1Byte=8bit

  • GBK 中文、英文转行为数字的标准

    1中文字符=2Byte=16bit

    1英文字符=1Byte=8bit

  • unicode 万国码

各个国家均有在列,2Byte 代表一个字符,不区分中英文。

1中文字符=1英文字符=2Byte=16bit
  • uft-8

万国码的优化版本。

1英文=1Byte=8bit
1中文=3Byte=24bit
字符编码总结
  1. pyhon3解释器默认的读取py的编码是utf-8
  2. python2解释器默认的读取py的编码是ascii
    可通过修改文件头的方式,修改默认的字符编码
    ```

    coding:utf-8

```

  1. 乱码问题出现的关键在于存文件的时候用一种编码,读文件用了另外一种编码

  2. 保证不乱码的关键在于:文件以什么编码存的就应该以什么编码读

猜你喜欢

转载自www.cnblogs.com/morron/p/8950800.html