重点
1. 什么是字符编码:将人识别的字符转换计算机能识别的01,转换的规则就是字符编码表
2. 常用的编码表:ascii、unicode、GBK、Shift_JIS、Euc-kr
3. 编码操作:编码encode()、解码decode()
知识储备
电脑三大核心:cpu - 内存 - 硬盘(数据的存取过程)
软件及python解释器读取文件过程:启动 - 读取 - 展示|解释执行
python2环境的文件头:# coding: 编码格式
简介与发展
1. ascii - 各国编码 - 万国编码
2. 存取不一致的乱码现象
3. unicode与utf-8
核心
编码操作:编码encode()、解码decode()
字符与字节
重点
1. 字节的存储方式:8个二进制位
2. 字符所占字节数:根据编码的不同,所占字节数可能不同
3. 三种格式字符串:u''、b''、r''
了解
u、b格式字符串转换: str(b'', encode='utf-8')、bytes(u'', encode='utf-8') '''
文件操作
重点
1. 文件操作的三步骤:打开文件 - 使用文件 - 关闭文件
2. 文件操作三要素:文件源、操作模式、编码
3. with语法:with open(...) as 别名, ..., open(...) as 别名: pass
4. 重点方法:read() | write() | readline() | close() | f.flush() | f.seek()
操作模式
主模式:r | w | a
从模式:b | t | +
了解:x | U
操作方法
读:read() | readline() | readlines()
写:write() | writelines() | flush()
光标:seek() | tell()
特征:encoding | closed
了解:readable() | writable() | name
案例
1. 文件复制
2. 文件修改
了解:py文件脚本机制