初学python之路-day37

1.GIL锁：

Global Interpreter Lock  全局解释器锁

在 Cpython中,这个全局解释器锁 或者 称为GIL,是一个互斥锁. 是为了防止多个本地
线程同一时间执行python字节码,

这个锁是非常重要的因为Cpython的内存管理是非线程安全的, ,然而这个GIL有存在的
必要性, 因为有很多已经存在的代码,需要依赖这个锁

非线程安全 即 多个线程访问同一个资源,会有有问题 
线程安全 即 多个线程访问同一个资源,不会有问题 

CPython中有一个互斥锁,防止线程同一时间执行python代码 ，该锁只存在Cpython中

之所以使用Cpython的原因?? 
C编译过的结果可以计算机直接识别  
最主要的原因,C语言以后大量现成的,库(算法,通讯),Cpython可以无缝连接C语言的任
何现成代码

2.内存管理与GIL锁

由于垃圾回收机制 ，python中不需要手动管理内存

当垃圾回收启动后会将计数为0的数据清除掉,回收内存
自动垃圾回收其实就是说,内部会有一个垃圾回收线程,会在某一时间运行起来,开始清理
垃圾

这是可能会产生问题,例如线程1申请了内存,但是还没有使用CPU切换到了GC,GC将数据
当成垃圾清理掉了 

 为了解决这个问题,Cpython就给解释器加上了GIL互斥锁!

为何给Cpython解释器加上GIL锁
Cpython诞生于1991年  而多核处理器诞生2004年  
当时不需要考虑多核效率问题  
现在为什么不拿掉这个锁,因为这期间,很多已经完成的代码都依赖于这个锁,如果直接换
掉，这些代码全得改，成本太大了

3.GIL锁的运用

GIL锁的加锁与解锁时机：
加锁: 只有有一个线程要使用解释器就立马枷锁  
解锁：1该线程任务结束

    2该线程遇到IO

    3该线程使用解释器过长    默认100纳秒

影响：
由于互斥锁的特性，程序串行，保证数据安全，降低执行效率，GIL将使得程序整体效率
降低！

解决方法：
区分任务类型：
1如果是IO密集使用多线程
2如果是计算密集使用多进程

GIL锁与自定义锁的关系：
GIL是加在解释器上的,只能锁住,解释器内部的资源,但是无法锁住我们自己开启资源 
例如: 我们自己开启了一个json文件,多个线程要同时访问, 如果第一个线程写入数据
写到一半,执行超时了,另一个线程过来接着写,就会产生问题,
自己开启共享资源还得自己所锁 
像是申请内存 保存数据等等就不需要我们程序员考虑了 GIL已经搞定了

4.线程池与进程池

池 Pool 指得是一个容器
线程池就是用来存储线程对象的 容器
好处：
1.自动管理线程的开启和销毁 
2.自动分配任务给空闲的线程
3.可以线程开启线程的数量 保证系统稳定     
信号量中是限制同时并发多少,但是线程已经全都建完了

使用：
from concurrent.futures import  ThreadPoolExecutor,ProcessPoolExecutor
from threading import enumerate,current_thread

# 1.创建池子 可以指定池子里有多少线程    如果不指定默认为CPU个数 * 5
# 不会立即开启线程 会等到有任务提交后在开启线程
# pool = ThreadPoolExecutor(10)   # 线程池最大值,应该机器所能承受的
最大值   当然需要考虑你的机器有几个任务要做
#
# # print(enumerate())
# def task(name,age):
#     print(name)
#     print(current_thread().name,"run")
#     time.sleep(2)
# #
#
# # 该函数提交任务到线程池中
# pool.submit(task,"jerry",10) #任务的参数  直接写到后面不需要定义
参数名称   因为是可变位置参数
# pool.submit(task,"owen",20)
# pool.submit(task)
#
# time.sleep(5)
#
# #
# print(enumerate())
#
#
#
"""
    线程池,不仅帮我们管理了线程的开启和销毁,还帮我们管理任务的分配
    特点: 线程池中的线程只要开启之后 即使任务结束也不会立即结束  因为后续可能
会有新任务
          避免了频繁开启和销毁线程造成的资源浪费
    1.创建一个线程池 
    2.使用submit提交任务到池子中   ,线程池会自己为任务分配线程  
      
"""

# 进程池的使用   同样可以设置最大进程数量 默认为cpu的个数
pool = ProcessPoolExecutor() # 具体的值也要参考机器性能

def task(name):
    print(os.getpid())
    print(name)

if __name__ == '__main__':
    pool.submit(task,"jerry")

    pool.shutdown()
 # 等待所有任务全部完毕 销毁所有线程 后关闭线程池

    pool.submit(task, "jerry")

5.同步异步

同步异步-阻塞非阻塞：
#### 阻塞非阻塞指的是程序的运行状态
阻塞：当程序执行过程中遇到了IO操作，在执行IO操作时，程序无法继续执行其他代码，
称为阻塞！

非阻塞：程序在正常运行没有遇到IO操作，或者通过某种方式使程序即时遇到了也不会停
在原地，还可以执行其他操作，以提高CPU的占用率

####同步-异步 指的是提交任务的方式

同步指调用：发起任务后必须在原地等待任务执行完成，才能继续执行

异步指调用：发起任务后必须不用等待任务执行，可以立即开启执行其他操作

**同步会有等待的效果但是这和阻塞是完全不同的，阻塞时程序会被剥夺CPU执行权，
而同步调用则不会！**

from concurrent.futures import ThreadPoolExecutor,ProcessPoolExecutor
import time
from concurrent.futures._base import Future

pool = ThreadPoolExecutor() # my cpu_count = 6     so  6 * 5 = 30
def task():
    time.sleep(2)
    print("执行完成!")
    return "一瓶黑牛!"

print("start")
# task()# 同步调用

# 1.发起一个异步任务
res = pool.submit(task)    # 异步调用   res就是一个表示异步任务的对象

# 2.定义一个回调函数   传的参数就是一个完成后任务对象
def finished(arg):
    print(arg.result())
    print("黑牛买回来了! ")
    pass


# 3.给这个异步任务添加了一个回调函数
res.add_done_callback(finished)

# pool.shutdown() # 阻塞直到线程池所有任务全部完成    会导致主线卡在原地
# print(res)

# print("执行的结果:",res.result())      # 会导致主线卡在原地

print("over")

6.异步回调

异步回调指的是：在发起一个异步任务的同时指定一个函数，在异步任务完成时会自
动的调用这个函数

### 为什么需要异步回调

之前在使用线程池或进程池提交任务时，如果想要处理任务的执行结果则必须调
用result函数或是shutdown函数，而它们都是是阻塞的，会等到任务执行完毕后才
能继续执行，这样一来在这个等待过程中就无法执行其他任务，降低了效率，所以需要
一种方案，即保证解析结果的线程不用等待，又能保证数据能够及时被解析，该方案就
是异步回调
import requests
from concurrent.futures import ThreadPoolExecutor
from threading import current_thread

pool = ThreadPoolExecutor()

# 获取数据
def get_data(url):
    response = requests.get(url)

    # return url,response.text
    print("%s下载完成!" % current_thread().name)
    parser(url,response.text)


# 解析数据
def parser(url,data):
    # url,data = obj.result()
    print("%s   长度%s" % (url, len(data)))
    print("%s解析完成!" % current_thread().name)

urls = [
    "http://www.baidu.com",
    "http://www.qq.com",
    "http://www.python.org",
    "http://www.sina.com",
    "http://www.oldboyedu.com",
]


"""
为嘛使用异步回调
1.生产者和消费者解开了耦合  
2.消费者可以及时处理生产完成的数据 
"""
for u in urls:
    obj = pool.submit(get_data,u)
    # obj.add_done_callback(parser)

print("提交完成!")

import requests
from concurrent.futures import ThreadPoolExecutor
from threading import current_thread

pool = ThreadPoolExecutor(2)

# 获取数据
def get_data(url):
    response = requests.get(url)
    print("%s下载完成!" % current_thread().name)
    return url,response.text


# 解析数据
def parser(obj):
    url,data = obj.result()
    print("%s   长度%s" % (url, len(data)))
    print("%s解析完成!" % current_thread().name)

urls = [
    "http://www.baidu.com",
    "http://www.qq.com",
    "http://www.python.org",
    "http://www.sina.com",
    "http://www.oldboyedu.com",
]


"""
为嘛使用异步回调
1.生产者和消费者解开了耦合  
2.消费者可以及时处理生产完成的数据 
"""
for u in urls:
    obj = pool.submit(get_data,u)
    obj.add_done_callback(parser)

print("提交完成!")

初学python之路-day37

猜你喜欢