day34 并发编程之进程与线程

1. 进程

1.1 进程对象及其他方法

计算机是通过给每一个进程一个PID号,以此来区分和管理计算机中的进程

1.1.1 如何查看进程

windows计算机

​ ——>进入cmd输入tasklist即可查看

​ ——>tasklist |findstr PID查看具体的进程

mac计算机

​ ——>进入终端之后输入ps aux

​ ——>ps aux|grep PID查看具体的进程

1.1.2 进程相关方法

操作进程的方法可以分为两种
#一种是通过模块multiprocessing下的Process和current_process操作
from multiprocessing import Process, current_process
import time


def task():
    print('%s is running'%current_process().pid)  
    # 查看当前进程的进程号
    time.sleep(30)

if '__name__'  == '__main__':
    p = Process(target = task)#创建进程
    p.strat()  #启动进程
    p.terminate() #杀死当前进程
    print(p.is_alive()) #判断进程是否存活
    
#第二种是通过os模块去查看进程
from multiprocessing import Process
import time,os

def task():
    print('%s is running'%os.getpid())  
    # 查看当前进程的进程号
    print('子进程的主进程号%s'%os.getppid())  
    # 查看当前进程的进程号
    time.sleep(30)

if __name__ == '__main__':
    p = Process(target=task)
    p.start()
    print('主')
    print('主',os.getpid())
    print('主主',os.getppid())  # 获取父进程的pid号

    """
    一般情况下我们会默认将
    存储布尔值的变量名
    和返回的结果是布尔值的方法名
    都起成以is_开头
    """

1.1.3 僵尸进程和孤儿进程(了解)

#僵尸进程
"""
当在父进程中开设子进程时,将子进程杀死并不会立刻释放所占用的进程号,父进程依然可以查看子进程的一些基本信息,如pid号,运行时间等
所有的进程都会步入僵尸进程(相当于一个状态)
回收子进程占用的pid号
	当父进程等待子进程运行结束
	当父进程调用join方法
	子进程自然死亡
"""
#孤儿进程
"""
子进程存活,父进程意外死亡
操作系统会开设一个“儿童福利院”专门管理孤儿进程回收相关资源
"""

1.2 守护进程

.daemon设置进程为守护进程

ps: 一定要在start()方法之上

from multiprocessing import Process
import time


def task(name):
    print('%s总管正在活着'% name)
    time.sleep(3)
    print('%s总管正在死亡' % name)


if __name__ == '__main__':
    p = Process(target=task,args=('egon',))
    # p = Process(target=task,kwargs={'name':'egon'})
    p.daemon = True  # 将进程p设置成守护进程  
    p.start()
    print('皇帝寿终正寝')

1.3 互斥锁

多个进程同时操作一份数据,可能出现数据错乱的问题

针对上述问题,解决方式就是加锁处理:将并发变成串行,牺牲效率但是保证了数据的安全

from multiprocessing import Process, Lock
import json
import time
import random


# 查票
def search(i):
    # 文件操作读取票数
    with open('data','r',encoding='utf8') as f:
        dic = json.load(f)
    print('用户%s查询余票:%s'%(i, dic.get('ticket_num')))


# 买票  1.先查 2.再买
def buy(i):
    # 先查票
    with open('data','r',encoding='utf8') as f:
        dic = json.load(f)
    # 模拟网络延迟
    time.sleep(random.randint(1,3))
    # 判断当前是否有票
    if dic.get('ticket_num') > 0:
        # 修改数据库 买票
        dic['ticket_num'] -= 1
        # 写入数据库
        with open('data','w',encoding='utf8') as f:
            json.dump(dic,f)
        print('用户%s买票成功'%i)
    else:
        print('用户%s买票失败'%i)


# 整合上面两个函数
def run(i, mutex):
    search(i)
    # 给买票环节加锁处理
    # 抢锁
    mutex.acquire()

    buy(i)
    # 释放锁
    mutex.release()


if __name__ == '__main__':
    # 在主进程中生成一把锁 让所有的子进程抢 谁先抢到谁先买票
    mutex = Lock()
    for i in range(1,11):
        p = Process(target=run, args=(i, mutex))
        p.start()
"""
扩展 行锁 表锁

注意:
	1.锁不要轻易的使用,容易造成死锁现象(我们写代码一般不会用到,都是内部封装好的)
	2.锁只在处理数据的部分加来保证数据安全(只在争抢数据的环节加锁处理即可) 
"""

1.4 进程间通信

1.4.1 队列Queue模块

"""
管道:subprocess 
	stdin stdout stderr
队列:管道+锁

队列:先进先出
堆栈:先进后出
"""
from multiprocessing import Queue

# 创建一个队列
q = Queue(2)  # 括号内可以传数字 标示生成的队列最大可以同时存放的数据量

# 往队列中存数据
q.put(111)
q.put(222)
# print(q.full())  # 判断当前队列是否满了
# print(q.empty())  # 判断当前队列是否空了

# q.put(666)  # 当队列数据放满了之后 如果还有数据要放程序会阻塞 直到有位置让出来 不会报错


# 去队列中取数据
v1 = q.get()
v2 = q.get()
# V3 = q.get_nowait()  # 没有数据直接报错queue.Empty
# v3 = q.get(timeout=3)  
# 没有数据之后原地等待三秒之后再报错  queue.Empty
try:
    v3 = q.get(timeout=3)
    print(v6)
except Exception as e:
    print('一滴都没有了!')

# # v3 = q.get()  
# 队列中如果已经没有数据的话 get方法会原地阻塞

"""
q.full()
q.empty()
q.get_nowait()
在多进程的情况下是不精确
"""

1.4.2 IPC机制

from multiprocessing import Queue, Process

"""
研究思路
    1.主进程跟子进程借助于队列通信
    2.子进程跟子进程借助于队列通信
"""
def producer(q):
    q.put('我是xxx 很高兴为您服务')

def consumer(q):
    print(q.get())

if __name__ == '__main__':
    q = Queue()
    p = Process(target=producer,args=(q,))
    p1 = Process(target=consumer,args=(q,))
    p.start()
    p1.start()

1.5 生产者消费者模型

"""
生产者:生产/制造东西的
消费者:消费/处理东西的
该模型除了上述两个之外还需要一个媒介
	生活中的例子做包子的将包子做好后放在蒸笼(媒介)里面,买包子的取蒸笼里面拿
	厨师做菜做完之后用盘子装着给你消费者端过去
	生产者和消费者之间不是直接做交互的,而是借助于媒介做交互
	
生产者(做包子的) + 消息队列(蒸笼) + 消费者(吃包子的)
"""
"""
    JoinableQueue 每当你往该队列中存入数据的时候 内部会有一个计数器+1
    没当你调用task_done的时候 计数器-1
    q.join() 当计数器为0的时候 才往后运行
"""
from multiprocessing import Process, Queue, JoinableQueue
import time
import random


def producer(name,food,q):
    for i in range(5):
        data = '%s生产了%s%s'%(name,food,i)
        # 模拟延迟
        time.sleep(random.randint(1,3))
        print(data)
        # 将数据放入 队列中
        q.put(data)


def consumer(name,q):
    # 消费者胃口很大 光盘行动
    while True:
        food = q.get()  # 没有数据就会卡住
        # 判断当前是否有结束的标识
        # if food is None:break
        time.sleep(random.randint(1,3))
        print('%s吃了%s'%(name,food))
        q.task_done()  # 告诉队列你已经从里面取出了一个数据并且处理完毕了


if __name__ == '__main__':
    # q = Queue()
    q = JoinableQueue()
    p1 = Process(target=producer,args=('大厨egon','包子',q))
    p2 = Process(target=producer,args=('马叉虫tank','泔水',q))
    c1 = Process(target=consumer,args=('春哥',q))
    c2 = Process(target=consumer,args=('新哥',q))
    p1.start()
    p2.start()
    # 将消费者设置成守护进程
    c1.daemon = True
    c2.daemon = True
    c1.start()
    c2.start()
    p1.join()
    p2.join()
    # 等待生产者生产完毕之后 往队列中添加特定的结束符号
    # q.put(None)  # 肯定在所有生产者生产的数据的末尾
    # q.put(None)  # 肯定在所有生产者生产的数据的末尾
    q.join()  # 等待队列中所有的数据被取完再执行往下执行代码

    # 只要q.join执行完毕 说明消费者已经处理完数据了  消费者就没有存在的必要了

2. 线程理论

2.1 什么是线程

"""
进程:资源单位
线程:执行单位

将操作系统比喻成一个大的工厂
那么进程就相当于工厂里面的车间
而线程就是车间里面的流水线

每一个进程肯定自带一个线程

再次总结:
	进程:资源单位(起一个进程仅仅只是在内存空间中开辟一块独立的空间)
	线程:执行单位(真正被cpu执行的其实是进程里面的线程,线程指的就是代码的执行过程,执行代码中所需要使用到的资源都找所在的进程索要)
	
进程和线程都是虚拟单位,只是为了我们更加方便的描述问题
"""

2.2 为何要有线程

"""
开设进程
	1.申请内存空间	耗资源
	2.“拷贝代码”   耗资源
开线程
	一个进程内可以开设多个线程,在用一个进程内开设多个线程无需再次申请内存空间操作

总结:
	开设线程的开销要远远的小于进程的开销
	同一个进程下的多个线程数据是共享的!!!
"""
我们要开发一款文本编辑器
	获取用户输入的功能
  实时展示到屏幕的功能
  自动保存到硬盘的功能
针对上面这三个功能,开设进程还是线程合适???
	开三个线程处理上面的三个功能更加的合理

备注:人工智能相关参考网站

http://www.turingapi.com/

https://www.xfyun.cn/?ch=bd05&b_scene_zt=1

http://ai.baidu.com/creation/main/demo

猜你喜欢

转载自www.cnblogs.com/Henry121/p/12763389.html