第八章文件、异常和模块

实际应用中，我们绝大多数的数据都是通过文件的交互完成的

8.1 文件的读写

8.1.1 文件的打开

文件的打开通用格式

with open("文件路径", "打开模式", encoding = "操作文件的字符编码") as f:
    "对文件进行相应的读写操作"
使用with 块的好处：执行完毕后，自动对文件进行close操作。

【例1】一个简单的文件读取

with open("E:\ipython\测试文件.txt", "r", encoding = "gbk") as f:     # 第一步：打开文件
    text = f.read()                                                   # 第二步：读取文件
    print(text)

我是一个测试文件

1、文件路径

完整路径，如上例所示
程序与文件在同一文件夹，可简化成文件名

with open("测试文件.txt", "r", encoding = "gbk") as f:     # 第一步：打开文件
    text = f.read()                                        # 第二步：读取文件
    print(text)

我是一个测试文件

2、打开模式

“r” 只读模式，如文件不存在，报错
“w” 覆盖写模式，如文件不存在，则创建；如文件存在，则完全覆盖原文件
“x” 创建写模式，如文件不存在，则创建；如文件存在，报错
“a” 追加写模式，如文件不存在，则创建；如文件存在，则在原文件后追加内容
“b” 二进制文件模式，不能单独使用，需要配合使用如"rb"，“wb”，“ab”，该模式不需指定encoding
“t” 文本文件模式，默认值，需配合使用如"rt"，“wt”，“at”，一般省略，简写成如"r"，“w”，“a”
“+”，与"r",“w”,“x”,"a"配合使用，在原功能基础上，增加读写功能
打开模式缺省，默认为只读模式

3、字符编码

万国码 utf-8

包含全世界所有国家需要用到的字符

中文编码 gbk

专门解决中文编码问题

windows系统下，如果缺省，则默认为gbk（所在区域的编码）
为清楚起见，除了处理二进制文件，建议不要缺省encoding

8.1.2 文件的读取

1、读取整个内容——f.read()

with open("三国演义片头曲_utf.txt", "r", encoding="utf-8") as f:       # 第一步：打开文件
    text = f.read()                                                    # 第二步：读取文件
    print(text)

临江仙·滚滚长江东逝水
滚滚长江东逝水，浪花淘尽英雄。
是非成败转头空。
青山依旧在，几度夕阳红。
白发渔樵江渚上，惯看秋月春风。
一壶浊酒喜相逢。
古今多少事，都付笑谈中。

with open("三国演义片头曲_utf.txt", encoding="utf-8") as f:     # "r"，可缺省，为清晰起见，最好写上
    text = f.read()                                                   
    print(text)

临江仙·滚滚长江东逝水
滚滚长江东逝水，浪花淘尽英雄。
是非成败转头空。
青山依旧在，几度夕阳红。
白发渔樵江渚上，惯看秋月春风。
一壶浊酒喜相逢。
古今多少事，都付笑谈中。

解码模式不匹配

with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:     
    text = f.read()                                                    
    print(text)

---------------------------------------------------------------------------

UnicodeDecodeError                        Traceback (most recent call last)

<ipython-input-6-8e9ea685585d> in <module>
      1 with open("三国演义片头曲_utf.txt", "r", encoding="gbk") as f:
----> 2     text = f.read()
      3     print(text)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence

with open("三国演义片头曲_utf.txt", "r") as f:     # encoding缺省，windows系统默认为"gbk"
    text = f.read()                                                    
    print(text)

---------------------------------------------------------------------------

UnicodeDecodeError                        Traceback (most recent call last)

<ipython-input-7-480622bc01aa> in <module>
      1 with open("三国演义片头曲_utf.txt", "r") as f:     # encoding缺省，windows系统默认为"gbk"
----> 2     text = f.read()
      3     print(text)
UnicodeDecodeError: 'gbk' codec can't decode byte 0x80 in position 50: illegal multibyte sequence

2、逐行进行读取——f.readline()

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    for i in range(3):
        text = f.readline()                                                   # 每次只读取一行
        print(text)

临江仙·滚滚长江东逝水

滚滚长江东逝水，浪花淘尽英雄。

是非成败转头空。

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    while True:
        text = f.readline()
        if not text:
            # print(text is "")
            break
        else:
            # print(text == "\n")
            print(text, end="")      # 保留原文的换行，使print()的换行不起作用

临江仙·滚滚长江东逝水
滚滚长江东逝水，浪花淘尽英雄。
是非成败转头空。

青山依旧在，几度夕阳红。
白发渔樵江渚上，惯看秋月春风。
一壶浊酒喜相逢。
古今多少事，都付笑谈中。

3、读入所有行，以每行为元素 形成一个列表——f.readlines()

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:
    text = f.readlines()              # 注意每行末尾有换行符
    print(text)

['临江仙·滚滚长江东逝水\n', '滚滚长江东逝水，浪花淘尽英雄。\n', '是非成败转头空。\n', '\n', '青山依旧在，几度夕阳红。\n', '白发渔樵江渚上，惯看秋月春风。\n', '一壶浊酒喜相逢。\n', '古今多少事，都付笑谈中。\n']

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    for text in f.readlines():                                                   
        print(text)                # 不想换行则用print(text, end="")

临江仙·滚滚长江东逝水

滚滚长江东逝水，浪花淘尽英雄。

是非成败转头空。



青山依旧在，几度夕阳红。

白发渔樵江渚上，惯看秋月春风。

一壶浊酒喜相逢。

古今多少事，都付笑谈中。

4、文本文件读取小结

文件比较大时，read()和readlines()占用内存过大，不建议使用

readline用起来又不太方便

with open("三国演义片头曲_gbk.txt", "r", encoding="gbk") as f:     
    for text in f:         # f本身就是一个可迭代对象，每次迭代读取一行内容 
        print(text)

临江仙·滚滚长江东逝水

滚滚长江东逝水，浪花淘尽英雄。

是非成败转头空。



青山依旧在，几度夕阳红。

白发渔樵江渚上，惯看秋月春风。

一壶浊酒喜相逢。

古今多少事，都付笑谈中。

5、二进制文件

图片：二进制文件

with open("test.jpg", "rb") as f:     
        print(len(f.readlines()))

8.1.3 文件的写入

1、向文件写入一个字符串或字节流（二进制）——f.write()

with open("第九套广播体操.txt", "w", encoding="utf-8") as f:                      
        f.write("大家好\n")        # 文件不存在则立刻创建一个
        f.write("欢迎一起做体操\n")        # 如需换行，末尾加换行符\n
        f.write("第一节\n")
        f.write("头部运动\n")

with open("第九套广播体操.txt", "w", encoding="utf-8") as f:                      
        f.write("第二节\n")        # 如果文件存在，新写入内容会覆盖掉原内容，一定要注意！！！
        f.write("伸展运动\n")        
        f.write("12345678\n")
        f.write("22345678\n")

2、追加模式——"a"

with open("第九套广播体操.txt", "a", encoding="utf-8") as f:                      
        f.write("第三节\n")        # 如果文件存在，新写入内容会覆盖掉原内容，一定要注意！！！
        f.write("腰部运动\n")        
        f.write("12345678\n")
        f.write("22345678\n")

3、将一个元素为字符串的列表整体写入文件——f.writelines()

ls = ["春天刮着风", "秋天下着雨", "我们要运动"]
with open("第九套广播体操.txt", "w", encoding="utf-8") as f:
    f.writelines(ls)

ls = ["春天刮着风\n", "秋天下着雨\n", "我们要运动\n"]
with open("第九套广播体操.txt", "w", encoding="utf-8") as f:
    f.writelines(ls)

8.1.4 既读又写

1、"r+"

如果文件名不存在，则报错
指针在开始
要把指针移到末尾才能开始写，否则会覆盖前面内容

with open("浪淘沙_北戴河.txt", "r+", encoding="gbk") as f:
#     for line in f:
#         print(line)   # 全部读一遍后，指针到达结尾
    f.seek(0,2)         # 或者可以将指针移到末尾f.seek(偏移字节数,位置（0：开始；1：当前位置；2：结尾）)
    text = ["萧瑟秋风今又是，\n", "换了人间。\n"]
    f.writelines(text)

2、"w+"

若文件不存在，则创建
若文件存在，会立刻清空原内容！！！

with open("浪淘沙_北戴河.txt", "w+", encoding="gbk") as f:
    pass

with open("浪淘沙_北戴河.txt", "w+", encoding="gbk") as f:
    text = ["萧瑟秋风今又是，\n", "换了人间。\n"]  # 清空原内容
    f.writelines(text)                             # 写入新内容，指针在最后
    f.seek(0,0)            # 指针移到开始
    print(f.read())        # 读取内容

3、"a+"

若文件不存在，则创建
指针在末尾，添加新内容，不会清空原内容

with open("浪淘沙_北戴河.txt", "a+", encoding="gbk") as f:
    f.seek(0,0)            # 指针移到开始
    print(f.read())        # 读取内容

大雨落幽燕，
白浪滔天。
秦皇岛外打鱼船。
一片汪洋都不见，
知向谁边？
往事越千年，
魏武挥鞭，
东临碣石有遗篇。
萧瑟秋风今又是，
换了人间。

with open("浪淘沙_北戴河.txt", "a+", encoding="gbk") as f:
    text = ["萧瑟秋风今又是，\n", "换了人间。\n"]  
    f.writelines(text)                             # 指针在最后,追加新内容， 
    f.seek(0,0)            # 指针移到开始
    print(f.read())        # 读取内容

大雨落幽燕，
白浪滔天。
秦皇岛外打鱼船。
一片汪洋都不见，
知向谁边？
往事越千年，
魏武挥鞭，
东临碣石有遗篇。
萧瑟秋风今又是，
换了人间。
萧瑟秋风今又是，
换了人间。

8.1.5 数据的存储与读取

通用的数据格式，可以在不同语言中加载和存储

本节简单了解两种数据存储结构csv和json

1、csv格式

由逗号将数据分开的字符序列，可以由excel打开

读取

with open("成绩.csv", "r", encoding="gbk") as f:
    ls = [] 
    for line in f:                              # 逐行读取
        ls.append(line.strip("\n").split(","))  # 去掉每行的换行符，然后用“,”进行分割
for res in ls:
    print(res)

['编号', '数学成绩', '语文成绩']
['1', '100', '98']
['2', '96', '99']
['3', '97', '95']

写入

ls = [['编号', '数学成绩', '语文成绩'], ['1', '100', '98'], ['2', '96', '99'], ['3', '97', '95']]
with open("score.csv", "w", encoding="gbk") as f:   # encoding="utf-8"中文出现乱码
    for row in ls:                                  # 逐行写入
        f.write(",".join(row)+"\n")                 # 用逗号组合成字符串形式，末尾加换行符

也可以借助csv模块完成上述操作

2、json格式

常被用来存储字典类型

写入——dump()

import json

scores = {"Petter":{"math":96 , "physics": 98},
        "Paul":{"math":92 , "physics": 99},
        "Mary":{"math":98 , "physics": 97}}
with open("score.json", "w", encoding="utf-8") as f:             # 写入整个对象 
        # indent 表示字符串换行+缩进 ensure_ascii=False 显示中文
        json.dump(scores, f, indent=4, ensure_ascii=False)

读取——load()

with open("score.json", "r", encoding="utf-8") as f:                                         
        scores = json.load(f)           # 加载整个对象
        for k,v in scores.items():
            print(k,v)

Petter {'math': 96, 'physics': 98}
Paul {'math': 92, 'physics': 99}
Mary {'math': 98, 'physics': 97}

8.2 异常处理

8.2.1 常见异常的产生

1、除0运算——ZeroDivisionError

1/0

---------------------------------------------------------------------------

ZeroDivisionError                         Traceback (most recent call last)

<ipython-input-1-9e1622b385b6> in <module>
----> 1 1/0


ZeroDivisionError: division by zero

2、找不到可读文件——FileNotFoundError

with open("nobody.csv") as f:
    pass

---------------------------------------------------------------------------

FileNotFoundError                         Traceback (most recent call last)

<ipython-input-2-f2e8c7d0ac60> in <module>
----> 1 with open("nobody.csv") as f:
      2     pass


FileNotFoundError: [Errno 2] No such file or directory: 'nobody.csv'

3、值错误——ValueError

传入一个调用者不期望的值，即使这个值的类型是正确的

s = "1.3"
n = int(s)

---------------------------------------------------------------------------

ValueError                                Traceback (most recent call last)

<ipython-input-8-69942d9db3c0> in <module>
      1 s = "1.3"
----> 2 n = int(s)


ValueError: invalid literal for int() with base 10: '1.3'

4、索引错误——IndexError

下标超出序列边界

ls = [1, 2, 3]
ls[5]

---------------------------------------------------------------------------

IndexError                                Traceback (most recent call last)

<ipython-input-9-acf459124b52> in <module>
      1 ls = [1, 2, 3]
----> 2 ls[5]


IndexError: list index out of range

5、类型错误——TypeError

传入对象类型与要求不符

1 + "3"

---------------------------------------------------------------------------

TypeError                                 Traceback (most recent call last)

<ipython-input-10-ee505dc42f75> in <module>
----> 1 1 + "3"
TypeError: unsupported operand type(s) for +: 'int' and 'str'

6、其他常见的异常类型

NameError 使用一个未被定义的变量
KeyError 试图访问字典里不存在的键

print(a)

---------------------------------------------------------------------------

NameError                                 Traceback (most recent call last)

<ipython-input-11-bca0e2660b9f> in <module>
----> 1 print(a)
NameError: name 'a' is not defined

d = {}
d["1"]

---------------------------------------------------------------------------

KeyError                                  Traceback (most recent call last)

<ipython-input-12-e629d551aca0> in <module>
      1 d = {}
----> 2 d["1"]
KeyError: '1'

当异常发生的时候，如果不预先设定处理方法，程序就会中断

8.2.2 异常的处理

提高程序的稳定性和可靠性

1、try_except

如果try内代码块顺利执行，except不被触发
如果try内代码块发生错误，触发except,执行except内代码块
单分支

x = 10
y = 0
try:
    z = x/y
except ZeroDivisionError:                  # 一般来说会预判到出现什么错误
    # z = x/(y+1e-7)
    # print(z)
    print("0不可以被除！")

0不可以被除！

x = 10
y = 0
try:
    z = x/y
except NameError:                  # 一般来说会预判到出现什么错误
    # z = x/(y+1e-7)
    # print(z)
    print("0不可以被除！")

---------------------------------------------------------------------------

ZeroDivisionError                         Traceback (most recent call last)

<ipython-input-14-aea58863ad72> in <module>
      2 y = 0
      3 try:
----> 4     z = x/y
      5 except NameError:                  # 一般来说会预判到出现什么错误
      6     # z = x/(y+1e-7)
ZeroDivisionError: division by zero

多分支

ls = []
d = {"name": "Faye"}
try:
    y = m
    # ls[3]
    # d["age"]
except NameError:
    print("变量名不存在")
except IndexError:
    print("索引超出界限")
except KeyError:
    print("键不存在")

变量名不存在

万能异常 Exception （所有错误的老祖宗）

ls = []
d = {"name": "Faye"}
try:
    # y = m
    ls[3]
    # d["age"]
except Exception:
    print("出错啦")

出错啦

捕获异常的值 as

ls = []
d = {"name": "Faye"}
# y = x
try:
    y = m
    # ls[3]
    # d["age"]
except Exception as e:    # 虽不能获得错误具体类型，但可以获得错误的值
    print(e)

name 'm' is not defined

2、try_except_else

如果try 模块执行，则else模块也执行

可以将else 看做try成功的额外奖赏

try:
    with open("浪淘沙_北戴河.txt") as f:
        text = f.read()
except FileNotFoundError:
    print("找不到该文件，ta是不是用了美颜？")
else:
    for s in ["\n", "，", "。", "？"]:         # 去掉换行符和标点符号
        text = text.replace(s, "")
    print("名作《浪淘沙_北戴河》共由{}个字组成。".format(len(text)))

名作《浪淘沙_北戴河》共由65个字组成。

3、try_except_finally

不论try模块是否执行，finally最后都执行

ls = []
d = {"name": "Faye"}
# y = x
try:
    y = m
    # ls[3]
    # d["age"]
except Exception as e:    # 虽不能获得错误具体类型，但可以获得错误的值
    print(e)
finally:
    print("不论触不触发异常，都将执行")

name 'm' is not defined
不论触不触发异常，都将执行

8.3 模块简介

已经被封装好

无需自己再“造轮子”

声明导入后，拿来即用

8.3.1 广义模块分类

1、Python 内置

时间库time\ 随机库random\ 容器数据类型collection\ 迭代器函数itertools

2、第三方库

数据分析numpy、pandas\ 数据可视化matplotlib\ 机器学习scikit-learn\ 深度学习Tensorflow

3、自定义文件

单独py文件
包——多个py文件

# 文件夹内多个py文件，再加一个__init__.py文件（内容可为空）

8.3.2 模块的导入

1、导入整个模块——import 模块名

**调用方式：**模块名.函数名或类名

import time

start = time.time()      # 调用time模块中的time()
time.sleep(3)            # 调用time模块中的sleep()  休息3秒钟
end = time.time()       
print("程序运行用时：{:.2f}秒".format(end-start))

程序运行用时：3.00秒

import fun1

fun1.f1()

导入fun1成功

2、从模块中导入类或函数——from 模块 import 类名或函数名

**调用方式：**函数名或类名

from itertools import product   

ls = list(product("AB", "123"))
print(ls)

[('A', '1'), ('A', '2'), ('A', '3'), ('B', '1'), ('B', '2'), ('B', '3')]

from function.fun1 import f1         # 注意这种用法

f1()

导入fun1成功

一次导入多个

from function import fun1, fun2

fun1.f1()
fun2.f2()

导入fun1成功
导入fun2成功

3、导入模块中所有的类和函数——from 模块 import *

**调用方式：**函数名或类名

from random import * 

print(randint(1,100))       # 产生一个[1,100]之间的随机整数
print(random())             # 产生一个[0,1)之间的随机小数

36
0.6582485822110181

8.3.3 模块的查找路径

模块搜索查找顺序：

1、内存中已经加载的模块

import fun1

fun1.f1()

导入fun1成功

# 删除硬盘上的fun1文件后再次执行
import fun1

fun1.f1()

导入fun1成功

# 修改硬盘上的fun1 文件
import fun1

fun1.f1()
# 居然没变，说明是优先从内存中读取的

导入fun1成功

2、内置模块

# Python 启动时，解释器会默认加载一些 modules 存放在sys.modules中
# sys.modules 变量包含一个由当前载入(完整且成功导入)到解释器的模块组成的字典, 模块名作为键, 它们的位置作为值
import sys

print(len(sys.modules))
print("math" in sys.modules)
print("numpy" in sys.modules)
for k,v in list(sys.modules.items())[:20]:
    print(k, ":", v)

738
True
False
sys : <module 'sys' (built-in)>
builtins : <module 'builtins' (built-in)>
_frozen_importlib : <module 'importlib._bootstrap' (frozen)>
_imp : <module '_imp' (built-in)>
_thread : <module '_thread' (built-in)>
_warnings : <module '_warnings' (built-in)>
_weakref : <module '_weakref' (built-in)>
zipimport : <module 'zipimport' (built-in)>
_frozen_importlib_external : <module 'importlib._bootstrap_external' (frozen)>
_io : <module 'io' (built-in)>
marshal : <module 'marshal' (built-in)>
nt : <module 'nt' (built-in)>
winreg : <module 'winreg' (built-in)>
encodings : <module 'encodings' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\__init__.py'>
codecs : <module 'codecs' from 'C:\\Users\\ibm\\Anaconda3\\lib\\codecs.py'>
_codecs : <module '_codecs' (built-in)>
encodings.aliases : <module 'encodings.aliases' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\aliases.py'>
encodings.utf_8 : <module 'encodings.utf_8' from 'C:\\Users\\ibm\\Anaconda3\\lib\\encodings\\utf_8.py'>
_signal : <module '_signal' (built-in)>
__main__ : <module '__main__'>

3、sys.path路径中包含的模块

import sys

sys.path

['E:\\ipython',
 'C:\\Users\\ibm\\Anaconda3\\python37.zip',
 'C:\\Users\\ibm\\Anaconda3\\DLLs',
 'C:\\Users\\ibm\\Anaconda3\\lib',
 'C:\\Users\\ibm\\Anaconda3',
 '',
 'C:\\Users\\ibm\\AppData\\Roaming\\Python\\Python37\\site-packages',
 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages',
 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages\\win32',
 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages\\win32\\lib',
 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages\\Pythonwin',
 'C:\\Users\\ibm\\Anaconda3\\lib\\site-packages\\IPython\\extensions',
 'C:\\Users\\ibm\\.ipython']

sys.path的第一个路径是当前执行文件所在的文件夹
若需将不在该文件夹内的模块导入，需要将模块的路径添加到sys.path

# import fun3

import sys

sys.path.append("C:\\Users\\ibm\\Desktop")    # 注意是双斜杠

import fun3

fun3.f3()

导入fun3成功

秃秃兔不秃

发布了18 篇原创文章 · 获赞 29 · 访问量 949

私信关注

深度之眼 - Python学习笔记——第八章文件、异常和模块

第八章文件、异常和模块

8.1 文件的读写

8.1.1 文件的打开

8.1.2 文件的读取

8.1.3 文件的写入

8.1.4 既读又写

8.1.5 数据的存储与读取

8.2 异常处理

8.2.1 常见异常的产生

8.2.2 异常的处理

8.3 模块简介

8.3.1 广义模块分类

8.3.2 模块的导入

8.3.3 模块的查找路径

猜你喜欢

深度之眼 - Python学习笔记——第八章 文件、异常和模块

第八章 文件、异常和模块

8.1 文件的读写

8.1.1 文件的打开

8.1.2 文件的读取

8.1.3 文件的写入

8.1.4 既读又写

8.1.5 数据的存储与读取

8.2 异常处理

8.2.1 常见异常的产生

8.2.2 异常的处理

8.3 模块简介

8.3.1 广义模块分类

8.3.2 模块的导入

8.3.3 模块的查找路径

猜你喜欢

深度之眼 - Python学习笔记——第八章文件、异常和模块

第八章文件、异常和模块