开进程开线程都需要消耗资源,只不过两者比较的情况线程消耗的资源比较少

在计算机能够承受范围之内最大限度的利用计算机

什么是池?

　　在保证计算机硬件安全的情况下最大限度的利用计算机

　　池其实是降低了程序的运行效率但是保证了计算机硬件的安全

　　(硬件的发展跟不上软件的速度)

from concurrent.futures import ThreadPoolExecutor
import time

pool = ThreadPoolExecutor(5)
def task(n):
    print(n) 
    time.sleep(2)
    return n**2

t_list = []
for i in range(20):
   res = pool.submit(task,i)
        # print(res.result())  # 原地等待任务的返回结果
    t_list.append(res)

    pool.shutdown()  # 关闭池子 等待池子中所有的任务执行完毕之后 才会往下运行代码
for p in t_list:
    print('>>>:',p.result())

线程池

from concurrent.futures import ThreadPoolExecutor
import time


pool = ThreadPoolExecutor(5) # 括号内可以传参数指定线程池内的线程个数
# 也可以不传  不传默认为当前计算机的cpu个数乘5

def task(n):
    print(n)
    time.sleep(1)
    return n**2

def call_back(n):
    print('拿到异步提交任务的返回结果:',n.result())

"""
提交任务的方式
    同步:提交任务之后 原地等待任务的返回结果  期间不做任何事情
    异步:提交任务之后 不等待任务的返回结果(异步的结果怎么拿??) 直接执行下一行代码
    
"""
"""
异步回调机制:当异步提交任务有返回结果之后,会自动触发回调函数的执行

"""

for i in range(10):
    pool.submit(task,i).add_done_callback(call_back)
    # 提交任务的时候 绑定一个回调函数 一旦该任务有结果 立刻执行对于的回调函数

进程池

from concurrent.futures ProcessPoolExecutor
import time
import os

pool = ProcessPoolExecutor()  # 默认是当前计算机cpu的个数
"""
池子中创建的进程/线程创建一次就不会再创建了
至始至终用的都是最初的那几个
这样的话节省了反复开辟进程/线程的资源
"""

def task(n):
    print(n,os.getpid())  # 查看当前进程号
    time.sleep(2)
    return n**2

def call_back(n):
    print('拿到了异步提交任务的返回结果:',n.result())


if __name__ == '__main__':
    for i in range(20):
        pool.submit(task,i).add_done_callback(call_back)

协程

　　进程:资源单位

　　线程:执行单位

　　协程:单线程下实现并发

并发

　　切换+保存状态

　　ps:看起来像同时执行的就可以称之为并发

协程:完全是程序员们想出来的名词

　　单线程下实现并发

并发的条件:

　　多道技术

　　　　空间上的复用

　　　　时间上的复用

　　　　　　切换+保存状态

程序员自己通过代码自己检测程序中的IO

一旦遇到IO自己通过代码切换

给操作系统的感觉是这个线程没有任何IO

ps:欺骗了操作系统让它误认为这个程序一直没有IO

　　从而保证程序在运行态和就绪态来回切换

　　提升代码的运行效率

切换+保存状态就一定能够提升效率吗?

　　当你的任务是IO密集型的情况下提升效率

　　当你的任务是计算密集型的情况下降低效率

import time
串行执行  0.10493969917297363
def func1():
    for i in range(1000000):
        i + 1
def func2():
    for i in range(1000000):
        i + 1
start = time.time()
func1()
func2()
print(time.time() - start)

基于yield并发执行    0.17088890075683594
def func1():
    while True:
        1000000 + 1
        yield
def func2():
    g = func1()
    for i in range(1000000):
        time.sleep(100)   # 模拟IO,yield并不会捕捉到并自动切换
        i + 1
        next(g)

start = time.time()
func2()
print(time.time() - start)

gevent模块

from gevent import monkey;monkey.patch_all()     # 由于该模块经常被使用 所以建议写成一行
from gevent import spawn
import time
"""
注意gevent模块没办法自动识别time.sleep等IO情况
需要你手动再配置一个参数
"""
def heng():
    print('heng')
    time.sleep(1)
    print('he')

def ha():
    print('ha')
    time.sleep(2)
    print('hhh')

start = time.time()
s1 = spawn(heng)    # spawn 会检测所有的任务
s2 = spawn(ha)
s1.join()
s2.join()
print(time.time() - start)

使用协程实现Tcp的服务端并发

服务端
from gevent import monkey;monkey.patch_all()
from gevent import spawn
import socket


sk = socket.socket()
sk.bind(('127.0.0.1',8080))
sk.listen(5)

def talk(conn):
    while True:
        try:
            data = conn.recv(1024)
            if len(data) == 0:break
            print(data.decode('utf-8'))
            conn.send(data.upper())
        except ConnectionResetError as e:
            print(e)
            break
    conn.close()
def server1():
    while True:
        conn, addr = sk.accept()
        spawn(talk,conn)

if __name__ == '__main__':

    g1 = spawn(server1)
    g1.join()

客户端
import socket
from threading import Thread,current_thread

def client1():
    sk = socket.socket()
    sk.connect(('127.0.0.1',8080))
    n = 0
    while True:
        data = '%s %s'%(current_thread().name,n)
        sk.send(data.encode('utf-8'))
        data = sk.recv(1024)
        print(data.decode('utf-8'))
        n += 1

for i in range(30):
    t = Thread(target=client1)
    t.start()

多进程下开多线程

多线程下再开协程

IO模型

为了更好地了解IO模型，我们需要事先回顾下：同步、异步、阻塞、非阻塞

同步（synchronous） IO和异步（asynchronous） IO，阻塞（blocking） IO和非阻塞（non-blocking）IO分别是什么，到底有什么区别？这个问题其实不同的人给出的答案都可能不同，比如wiki，就认为asynchronous IO和non-blocking IO是一个东西。这其实是因为不同的人的知识背景不同，并且在讨论这个问题的时候上下文(context)也不相同。所以，为了更好的回答这个问题，我先限定一下本文的上下文。

本文讨论的背景是Linux环境下的network IO。本文最重要的参考文献是Richard Stevens的“UNIX® Network Programming Volume 1, Third Edition: The Sockets Networking ”，6.2节“I/O Models ”，Stevens在这节中详细说明了各种IO的特点和区别，如果英文够好的话，推荐直接阅读。Stevens的文风是有名的深入浅出，所以不用担心看不懂。本文中的流程图也是截取自参考文献。

Stevens在文章中一共比较了五种IO Model：
    * blocking IO 阻塞IO
    * nonblocking IO 非阻塞IO
    * IO multiplexing IO多路复用
    * signal driven IO 信号驱动IO
    * asynchronous IO 异步IO
    由signal driven IO（信号驱动IO）在实际中并不常用，所以主要介绍其余四种IO Model。

再说一下IO发生时涉及的对象和步骤。对于一个network IO (这里我们以read举例)，它会涉及到两个系统对象，一个是调用这个IO的process (or thread)，另一个就是系统内核(kernel)。当一个read操作发生时，该操作会经历两个阶段：

#1）等待数据准备 (Waiting for the data to be ready)
#2）将数据从内核拷贝到进程中(Copying the data from the kernel to the process)

进程池与线程池,协程

线程池

进程池

协程

gevent模块

使用协程实现Tcp的服务端并发

IO模型

阻塞IO(blocking IO)

非阻塞IO(non-blocking IO)

多路复用IO(IO multiplexing)

异步IO(Asynchronous I/O)

猜你喜欢