什么是字符编码?
将人类的字符转化成计算机能够识别的数字0 1 ,字符编码就是一个由字符转成数字的标准。
字符编码表:
ASCII: 只有英文还有键盘上所有的符号转化成数字的标准
1英文字符=1Byte=8bit
GBK 中文、英文转行为数字的标准
1中文字符=2Byte=16bit
1英文字符=1Byte=8bit
unicode 万国码
各个国家均有在列,2Byte 代表一个字符,不区分中英文。
1中文字符=1英文字符=2Byte=16bit
- uft-8
万国码的优化版本。
1英文=1Byte=8bit
1中文=3Byte=24bit
字符编码总结
- pyhon3解释器默认的读取py的编码是utf-8
python2解释器默认的读取py的编码是ascii
可通过修改文件头的方式,修改默认的字符编码
```coding:utf-8
```
乱码问题出现的关键在于存文件的时候用一种编码,读文件用了另外一种编码
保证不乱码的关键在于:文件以什么编码存的就应该以什么编码读