Python3学习笔记_F(垃圾回收)


笔记中代码均可运行在Jupyter NoteBook下(实际上Jupyter-lab使用体验也很棒)。

建议不要光看,要多动手敲代码。眼过千遭,不如手读一遍。

相关笔记的jupiter运行代码已经上传,请在资源中自行下载。

垃圾回收

参考网址:https://www.cnblogs.com/jin-xin/articles/9439483.html

概括:

同一代码块下:缓存机制
不同代码块:小数据池

代码块

一个模块、一个函数、一个类、一个文件都是一个代码块。

在交互式命令行下,一个命令就是一个代码块。

代码块的缓存机制

Python在执行同一个代码块的初始化对象的命令时,

会检查是否其值是否已经存在,如果存在,会将其重用。

换句话说:

执行同一个代码块时,遇到初始化对象的命令时,

他会将初始化的这个变量与值存储在一个字典中,

在遇到新的变量时,会先在字典中查询记录,

如果有同样的记录那么它会重复使用这个字典中的之前的这个值。

满足缓存机制则他们在内存中只存在一个,即:id相同。

代码块的缓存机制的适用范围: int(float),str,bool。

int(float):任何数字在同一代码块下都会复用。

bool:True和False在字典中会以1,0方式存在,并且复用。

str:几乎所有的字符串都会符合缓存机制
        
        1,非乘法得到的字符串都满足代码块的缓存机制
        
        2,乘法得到的字符串分两种情况:

              2.1 乘数为1时,任何字符串满足代码块的缓存机制:
                
              2.2 乘数>=2时:仅含大小写字母,数字,下划线,
              总长度<=20,满足代码块的缓存机制

优点:

能够提高一些字符串,整数处理人物在时间和空间上的性能;
需要值相同的字符串,整数的时候,直接从‘字典’中取出复用,避免频繁创建和销毁,提升效率,节约内存。
'''jupyter这里运行存在问题,以注释为主'''

# 字符串缓存机制 例子

# 非乘法得到的字符串
def unMult():
    s1 = 'string'
    s2 = 'string'
    print('非乘法得到的字符串')
    print('*'*30)
    print('s1和s2地址比较:',id(s1) == id(s2)) # True
    print('*'*30)

# 乘数为1得到的字符串
def multOne():
    s3 = 'asdf!@#$%^*'*1
    s4 = 'asdf!@#$%^*'*1
    print('乘数为1得到的字符串')
    print('*'*30)
    print('s3和s4地址比较:',id(s3) == id(s4)) # True
    print('*'*30)
   
# 乘数>=2时
def multMore():
    s3 = 'adf!'*4 # 包含其他字符,总长<20
    s4 = 'adf!'*4
    s5 = 'qwertyuiop[]asdfghjk!@#$%^&'*4
    # 包含其他字符,总长>20
    s6 = 'qwertyuiop[]asdfghjk!@#$%^&'*4
    s7 = 'asdf_asdf'*3 # # 不包含其他字符,总长<20
    s8 = 'asdf_asdf'*3
    
    print('乘数为>=2,总长度<=20,包含其他字符得到的字符串')
    print('*'*30)
    print('s3和s4地址比较:',id(s3) == id(s4)) # False
    print('*'*30)
    
    print('乘数为>=2,总长度>20,包含其他字符得到的字符串')
    print('*'*30)
    print('s5和s6地址比较:',id(s5) == id(s6)) # False
    print('*'*30)
    
    print('乘数为>=2,总长度<=20,不包含其他字符得到的字符串')
    print('*'*30)
    print('s7和s8地址比较:',id(s7) == id(s8)) # True
    print('*'*30)
    
# test
unMult()
multOne()
multMore()
非乘法得到的字符串
******************************
s1和s2地址比较: True
s1和s2来源比较: True
******************************
乘数为1得到的字符串
******************************
s3和s4地址比较: True
s3和s4来源比较: True
******************************
乘数为>=2,总长度<=20,包含其他字符得到的字符串
******************************
s3和s4地址比较: True
s3和s4来源比较: True
******************************
乘数为>=2,总长度>20,包含其他字符得到的字符串
******************************
s5和s6地址比较: True
s5和s6来源比较: True
******************************
乘数为>=2,总长度<=20,不包含其他字符得到的字符串
******************************
s7和s8地址比较: True
s7和s8来源比较: True
******************************

小数据池

大前提:

小数据池也是只针对 int(float),str,bool。

小数据池是针对不同代码块之间的缓存机制!!!

Python自动将-5~256的整数进行了缓存,

当你将这些整数赋值给变量时,并不会重新创建对象,

而是使用已经创建好的缓存对象。

python会将一定规则的字符串在字符串驻留池中创建一份。

'''小数据池例子'''

# 整数
a = 100
b = 100
c = 123456
d = 123456

print('id(a) == id(b): ',id(a) == id(b))
print('id(c) == id(d): ',id(c) == id(d))

id(a) == id(b):  True
id(c) == id(d):  False

指定驻留

# 指定驻留 例子
from sys import intern

a = 'asd*&'*3
b = 'asd*&'*3

print('未指定驻留:a is b:', a is b)
print(id(a))
print(id(b))

c = intern('asd*&'*3)
d = intern('asd*&'*3)

print('指定驻留:c is d:', c is d)
print(id(c))
print(id(d))
未指定驻留:a is b: False
139839647396976
139839643255088
不未指定驻留:c is d: True
139839642805680
139839642805680

引用计数

Python中以引用计数为主:

引用计数优点:简单,实时性

引用计数缺点:维护时占用内存,循环引用,造成内存泄漏

引用计数减一不止del,还可以透过赋值None

隔代回收

Ruby中的垃圾回收是标记清除,对内存的申请是一次申请多个,
当内存不够用时再清理,而Python中的内存申请是用一个申请一个。

隔代回收为辅:

零代链表中检测到相互循环引用的减一,得到是否是垃圾(引用计数为0),需要回收,否则不会减一
GC模块
'''
gc.get_count():获取当前自动执行垃圾回收的计数器

返回一个元组(x,y,z)
参数解释:
[
x 表示内存占用,
y 表示零代清理次数,
z 同理表示1代清理次数
]


gc.get_threshold() 获取的gc模块中自动执行垃圾回收的频率

返回(x,y,z) 

参数解释:
[
x表示清理上限,
y表示每清理零代链表10次,
清理一次 1 代链表。
z同理是1,2代 这里的x,y,z默认值为(700,10,10)
]

查看一个对象的引用计数:

sys.getrefcount()

gc.disable() 关闭Python的gc

gc.enable() 开启gc

gc.isenabled() 判断是否是开启gc的

gc.collect([generation])显式进行垃圾回收(手动回收)

可以输入参数:
[
0代表只检查第一代的对象,

1代表检查一,二代的对象,

2代表检查一,二,三代的对象,
如果不传参数,执行一个full collection,也就是等于传2。
]


注意:
尽量不要手动重写对象的__del__方法,
因为重写后会使删除时不会自动调用gc来删除,
此时需要调用父类的__del__()来删除
'''

# gc 引用计数 示例
import gc, sys

a = 1
get_a_c = sys.getrefcount(a)
b = a
get_b_c = sys.getrefcount(a)

gc_c = gc.get_count()
gc_t = gc.get_threshold()

gc.disable()
gc.enable()

gc_is = gc.isenabled()

gc_cl = gc.collect(2)

print(get_a_c, get_b_c, gc_c, gc_t, gc_is, gc_cl)
2275 2275 (603, 5, 0) (700, 10, 10) True 921
发布了13 篇原创文章 · 获赞 0 · 访问量 24

猜你喜欢

转载自blog.csdn.net/qq_34764582/article/details/104940477