Python并发解决方案

一、subprocess模块

call():执行命令,返回程序返回码(int)

import subprocess

print(subprocess.call("mspaint"))

check_output():执行命令,返回输出(bytes)

import subprocess

import chardet

output = subprocess.check_output("ipconfig")

encoding = chardet.detect(output)['encoding']

print(output.decode(encoding, errors="ignore"))

二、threading模块

Thread

构造函数-参数:

target: 执行的操作(可调用对象,必选的)

name: 线程名(字符串,可选的)

args: 可调用对象需要的参数(位置参数部分,元组)

kwargs: 可调用对象需要的参数(关键字参数部分,字典)

from threading import  Thread

t = Thread(

    target=print,

    args=(1, 2, 3),

    kwargs={'sep': '->', 'end': '\n' * 10}

)

t.start()

方法:

start(): 启动线程(开始交给CPU执行)

run():start()启动之后,会被自动调用的方法。(子类可重写)

join(): 让父级线程等待自己完成(必须要在调用start()之后才能调用)

属性:

name:线程名称

daemon:是否是后台线程(若要设置该值,必须要在调用start()方法之前)

ident: 线程ID

Event:

set(): 设置值为True

clear(): 设置值为False

wait(): 等待

is_set():判断值是否为True

函数:

main_thread():得到主线程对象

active_count():得到活跃线程数目

current_thread():得到当前所在的线程对象

enumerate():返回迭代器,得到所有的活跃线程

关于daemon:

在脚本运行过程中有一个主线程,若在主线程中创建了子线程,当主线程结束时根据子线程daemon属性值的不同可能会发生下面的两种情况之一:

如果某个子线程的daemon属性为False,主线程结束时会检测该子线程是否结束,如果该子线程还在运行,则主线程会等待它完成后再退出;

如果某个子线程的daemon属性为True,主线程运行结束时不对这个子线程进行检查而直接退出,同时所有daemon值为True的子线程将随主线程一起结束,而不论是否运行完成。

属性daemon的值默认为False,如果需要修改,必须在调用start()方法启动线程之前进行设置。

另外要注意的是,上面的描述并不适用于IDLE环境中的交互模式或脚本运行模式,因为在该环境中的主线程只有在退出Python IDLE时才终止。

三、multiprocessing模块

Process() 创建一个进程对象,构造函数参数如下

target:要执行的操作(函数)(必须)

name:进程名(可选)

args:传递给target的函数执行时需要的位置、可选参数(按位置指定)

kwargs:传递给target的函数执行时需要的关键字参数(按名称指定)

进程对象(实例)方法:

start():启动进程

run():进程启动后,实际执行的方法,一般重写此方法。

terminate():强制结束进程

join():等待所有子进程执行完成

进程对象(实例)属性:

name:进程名

daemon:是否是后台进程

pid: 进程id

Pool(),创建一个进程池,构造函数参数(都是可选的)如下:

numprocess:进程池大小(同时有几个进程在工作)(默认为当前电脑的CPU核心数)

initializer:每个进程启动时执行的操作(函数)

initargs:传递给initializer的函数执行需要的参数(元组)

Pool对象方法:

执行方法:

apply(func, args, kwargs):(同步)执行一个。(返回值,func的返回结果)

apply_async(func, args, kwargs):(异步)执行一个。(返回值:ApplyResult,与AsyncResult类似,需要在进程池中所有任务完成后调用其get()方法取数据)

map(func,iterable, chunksize):(同步)一次取N个放到进程池中执行(N为进程池大小),等到本次取出的都执行完了再取下一批。(返回值:list,与外部数据顺序一致)

map_async(func,iterable, chunksize):(异步)一次取N个放到进程池中执行(N为进程池大小),只要进程池中有空闲位置,就取会数据,保证进程池一直是忙碌的。(返回值: AsyncResult,需要在进程池中所有任务完成后调用其get()方法取数据)

imap(func, iterable, chunksize):与map()类似,返回可迭代对象,返回数据的顺序和外部传递的数据顺序一致。

imap_unordered(func, iterable, chunksize):与map()类似,但是返回数据的顺序不能确定(当对数据顺序没有要求时使用)。

进程池管理方法():

close():关闭进程池,但是会等待池中作业完成

terminate():停止进程池中的作业,会关闭进程池

join():等待进程池中所有任务完成(需要先关闭进程池)

AsyncResult方法:

get(timeout):timeout可选。获取结果

ready():判断进程池中任务是否执行完毕。

successful():判断进程池中任务是否都正常完成了(只要有一个进程出错了,就会返回False)。

wait(timeout):timeout可选。

Manager()托管对象。

dict(): 共享字典

Event(): 共享事件

list(): 共享列表

Value(typecode, value): 共享的单个值

multiprocessing.dummy.Pool() 线程池:

from multiprocessing.dummy import Pool as ThreadPool

pool_size = 4 # 线程池大小

tpool = ThreadPool(pool_size)  # 创建线程池

进程池有的方法,线程池都有。 

获取CPU核心数:

标准库- multiprocessingimport multiprocessing

multiprocessing.cpu_count()

第三方- psutilimport psutil

psutil.cpu_count()

注意:Python中的多进程,启动代码需要在if__name__ == "__main__"中,多进程代码,不能在交互式环境中执行,应该使用python xxx.py的方式执行。

参考:17.2. multiprocessing — Process-based parallelism

附加:

numpy

.mean():求平均值

.sum(): 求和

uuid

uuid4():生成唯一id(UUID类型,可以通过str()转成字符串)

 

1.         subprocess模块

2.         threading模块

3.         multiprocessing模块

 

一、             subprocess模块

call():执行命令,返回程序返回码(int

import subprocess

 

print(subprocess.call("mspaint"))

 

check_output():执行命令,返回输出(bytes

import subprocess

import chardet

 

output = subprocess.check_output("ipconfig")

encoding = chardet.detect(output)['encoding']

print(output.decode(encoding, errors="ignore"))

 

二、             threading模块

Thread

    构造函数-参数:

n  target: 执行的操作(可调用对象,必选的)

n  name: 线程名(字符串,可选的)

n  args: 可调用对象需要的参数(位置参数部分,元组)

n  kwargs: 可调用对象需要的参数(关键字参数部分,字典)

   

from threading import  Thread

 

t = Thread(

    target=print,

    args=(1, 2, 3),

    kwargs={'sep': '->', 'end': '\n' * 10}

)

 

t.start()

    方法:

n  start(): 启动线程(开始交给CPU执行)

n  run()start()启动之后,会被自动调用的方法。(子类可重写)

n  join(): 让父级线程等待自己完成(必须要在调用start()之后才能调用)

    属性:

n  name:线程名称

n  daemon:是否是后台线程(若要设置该值,必须要在调用start()方法之前)

n  ident: 线程ID

Event:

n  set(): 设置值为True

n  clear(): 设置值为False

n  wait(): 等待

n  is_set():判断值是否为True

函数:

n  main_thread():得到主线程对象

n  active_count():得到活跃线程数目

n  current_thread():得到当前所在的线程对象

n  enumerate():返回迭代器,得到所有的活跃线程

关于daemon

在脚本运行过程中有一个主线程,若在主线程中创建了子线程,当主线程结束时根据子线程daemon属性值的不同可能会发生下面的两种情况之一:

l  如果某个子线程的daemon属性为False,主线程结束时会检测该子线程是否结束,如果该子线程还在运行,则主线程会等待它完成后再退出;

l  如果某个子线程的daemon属性为True,主线程运行结束时不对这个子线程进行检查而直接退出,同时所有daemon值为True的子线程将随主线程一起结束,而不论是否运行完成。

属性daemon的值默认为False,如果需要修改,必须在调用start()方法启动线程之前进行设置。

另外要注意的是,上面的描述并不适用于IDLE环境中的交互模式或脚本运行模式,因为在该环境中的主线程只有在退出Python IDLE时才终止。

三、             multiprocessing模块

Process() 创建一个进程对象,构造函数参数如下

u  target:要执行的操作(函数)(必须)

u  name:进程名(可选)

u  args:传递给target的函数执行时需要的位置、可选参数(按位置指定)

u  kwargs:传递给target的函数执行时需要的关键字参数(按名称指定)

进程对象(实例)方法:

n  start():启动进程

n  run():进程启动后,实际执行的方法,一般重写此方法。

n  terminate():强制结束进程

n  join():等待所有子进程执行完成

进程对象(实例)属性:

n  name:进程名

n  daemon:是否是后台进程

n  pid: 进程id

Pool(),创建一个进程池,构造函数参数(都是可选的)如下:

u  numprocess进程池大小(同时有几个进程在工作)(默认为当前电脑的CPU核心数)

u  initializer:每个进程启动时执行的操作(函数)

u  initargs:传递给initializer的函数执行需要的参数(元组)

Pool对象方法:

         执行方法:

n  apply(func, args, kwargs):(同步)执行一个。(返回值,func的返回结果)

n  apply_async(func, args, kwargs):(异步)执行一个。(返回值:ApplyResult,与AsyncResult类似,需要在进程池中所有任务完成后调用其get()方法取数据)

n  map(func,iterable, chunksize):(同步)一次取N个放到进程池中执行(N为进程池大小),等到本次取出的都执行完了再取下一批。(返回值:list,与外部数据顺序一致)

n  map_async(func,iterable, chunksize):(异步)一次取N个放到进程池中执行(N为进程池大小),只要进程池中有空闲位置,就取会数据,保证进程池一直是忙碌的。(返回值: AsyncResult,需要在进程池中所有任务完成后调用其get()方法取数据)

n  imap(func, iterable, chunksize):与map()类似,返回可迭代对象,返回数据的顺序和外部传递的数据顺序一致。

n  imap_unordered(func, iterable, chunksize):与map()类似,但是返回数据的顺序不能确定(当对数据顺序没有要求时使用)。

         进程池管理方法()

u  close():关闭进程池,但是会等待池中作业完成

u  terminate():停止进程池中的作业,会关闭进程池

u  join():等待进程池中所有任务完成(需要先关闭进程池)

         AsyncResult方法:

l  get(timeout)timeout可选。获取结果

l  ready():判断进程池中任务是否执行完毕。

l  successful():判断进程池中任务是否都正常完成了(只要有一个进程出错了,就会返回False)。

l  wait(timeout)timeout可选。

Manager()托管对象。

n  dict(): 共享字典

n  Event(): 共享事件

n  list(): 共享列表

n  Value(typecode, value): 共享的单个值

multiprocessing.dummy.Pool() 线程池:

from multiprocessing.dummy import Pool as ThreadPool

 

pool_size = 4 # 线程池大小

tpool = ThreadPool(pool_size)  # 创建线程池

进程池有的方法,线程池都有。

         获取CPU核心数

标准库- multiprocessing

import multiprocessing

 

multiprocessing.cpu_count()

第三方- psutil

import psutil

 

psutil.cpu_count()

 

注意:Python中的多进程,启动代码需要在if__name__ == "__main__"中,多进程代码,不能在交互式环境中执行,应该使用python xxx.py的方式执行。

参考:17.2. multiprocessing — Process-based parallelism

 

附加:

numpy

         .mean():求平均值

         .sum(): 求和

uuid

         uuid4():生成唯一idUUID类型,可以通过str()转成字符串)

猜你喜欢

转载自www.cnblogs.com/sxqfuture/p/9982085.html