多任务中多线程和多进程的区别

首先来说下为什么要实现多任务，众所周知，程序执行的时候都是自上而下的运行的，然而随着代码量的增加，执行单一任务的效率会非常差。就好比你以前都是先做完语文作业，再做数学作业，然后再做英语作业，那有没有一种方法，类似于分身术一般，在做语文作业的同时，把数学作业和英语作业一起做了。这就是多任务的实现。多任务，打破了原来从上而下的规规矩矩的执行方式。能帮助你在同一时间执行多种任务。

多进程

进程其实是资源的分配的单位，包括代码、内存、CPU等等，多进程类似程序的多开，比如qq的多开。
下面是一个简单的多进程的创建，我们可以看到在main函数下创建了两个子进程。

import multiprocessing
import time

def test1():
    while True:
        print('--- this is process 1 ---')
        time.sleep(2)
def test2():
    while True:
        print('--- this is process 2 ---')
        time.sleep(2)

def main():
    t1 = multiprocessing.Process(target=test1)
    t2 = multiprocessing.Process(target=test2)
    t1.start()
    t2.start()

下图解释了多进程工作的原理，在主进程下，子进程1和子进程2分别复制了主进程的代码以及资源，而子进程1则只运行test1这个函数，子进程2则只运行test2这个函数，进程之间的全局变量互不影响，对资源的开销比较大。

在这里插入图片描述打开任务管理器，结束任意子进程，发现主进程和子进程2没有受到影响，仍然继续运行，而当我们结束主进程的时候，所有子进程全部结束。

多线程

在一个进程中我们也可以使用多任务，这就是线程，线程其实是操作系统资源调度的单位。多线程可以共享全局变量。
下面是一个简单的使用方法来创建多线程的例子。

import threading
import time


num = 100

def test1():
    global num
    num += 1
    print('-----子线程1---num=%d' % num)


def test2():
    print('-----子线程2---num=%d' % num)


def main():
    t1 = threading.Thread(target=test1)
    t2 = threading.Thread(target=test2)

    t1.start()
    time.sleep(1)

    t2.start()
    time.sleep(1)

    print('-----main进程---num=%d' % num)

if __name__ == '__main__':
    main()

多线程并不会复制主进程的代码和资源，而是共享全局变量，相比多进程来说，资源开销更加小。在同一时间，子线程1和子线程2同时运行，实现多任务，而他们会共享全局变量num，所以print的值都是101.
在这里插入图片描述

多进程多线程的区别和选择（总结）

关于多进程和多线程，教科书上最经典的一句话是“进程是资源分配的最小单位，线程是CPU调度的最小单位”，这句话应付考试基本上够了，但如果在工作中遇到类似的选择问题，那就没有这么简单了，选的不好，会让你深受其害。

经常在网络上看到有的XDJM问“多进程好还是多线程好？”、“Linux下用多进程还是多线程？”等等期望一劳永逸的问题，我只能说：没有最好，只有更好。根据实际情况来判断，哪个更加合适就是哪个好。

我们按照多个不同的维度，来看看多线程和多进程的对比（注：因为是感性的比较，因此都是相对的，不是说一个好得不得了，另外一个差的无法忍受）。

在这里插入图片描述
1）需要频繁创建销毁的优先用线程

原因请看上面的对比。

扫描二维码关注公众号，回复： 6136750 查看本文章

这种原则最常见的应用就是Web服务器了，来一个连接建立一个线程，断了就销毁线程，要是用进程，创建和销毁的代价是很难承受的

2）需要进行大量计算的优先使用线程

所谓大量计算，当然就是要耗费很多CPU，切换频繁了，这种情况下线程是最合适的。

这种原则最常见的是图像处理、算法处理。

3）强相关的处理用线程，弱相关的处理用进程

什么叫强相关、弱相关？理论上很难定义，给个简单的例子就明白了。

一般的Server需要完成如下任务：消息收发、消息处理。“消息收发”和“消息处理”就是弱相关的任务，而“消息处理”里面可能又分为“消息解码”、“业务处理”，这两个任务相对来说相关性就要强多了。因此“消息收发”和“消息处理”可以分进程设计，“消息解码”、“业务处理”可以分线程设计。

当然这种划分方式不是一成不变的，也可以根据实际情况进行调整。

4）可能要扩展到多机分布的用进程，多核分布的用线程

原因请看上面对比。

5）都满足需求的情况下，用你最熟悉、最拿手的方式

至于“数据共享、同步”、“编程、调试”、“可靠性”这几个维度的所谓的“复杂、简单”应该怎么取舍，我只能说：没有明确的选择方法。但我可以告诉你一个选择原则：如果多进程和多线程都能够满足要求，那么选择你最熟悉、最拿手的那个。

需要提醒的是：虽然我给了这么多的选择原则，但实际应用中基本上都是“进程+线程”的结合方式，千万不要真的陷入一种非此即彼的误区。
消耗资源：

从内核的观点看，进程的目的就是担当分配系统资源（CPU时间、内存等）的基本单位。线程是进程的一个执行流，是CPU调度和分派的基本单位，它是比进程更小的能独立运行的基本单位。

线程，它们彼此之间使用相同的地址空间，共享大部分数据，启动一个线程所花费的空间远远小于启动一个进程所花费的空间，而且，线程间彼此切换所需的时间也远远小于进程间切换所需要的时间。据统计，总的说来，一个进程的开销大约是一个线程开销的30倍左右，当然，在具体的系统上，这个数据可能会有较大的区别。
此段转载自https://blog.csdn.net/yu876876/article/details/82810178