Python(廖)之进程和线程(多线程)

1. 多任务可以由多进程完成,也可以由一个进程内的多线程完成

2. 一个进程至少有一个线程

3. 线程是操作系统直接支持的执行单元,因此,高级语言通常都内置多线程的支持。

4.Python的线程是真正的Posix Thread,而不是模拟出来的线程。

5.Python的标准库提供了两个模块:_thread和threading。_thread是低级模块,threading是高级模块,对_thread进行了封装。一般情况下,只需要使用threading模块

6.启动一个线程就是把一个函数传入并创建Thread实例,然后调用start()开始执行:

import time, threading

# 新线程执行的代码:
def loop():
    print('thread %s is running...' % threading.current_thread().name)
    n = 0
    while n < 5:
        n = n + 1
        print('thread %s >>> %s' % (threading.current_thread().name, n))
        time.sleep(1)
    print('thread %s ended.' % threading.current_thread().name)

print('thread %s is running...' % threading.current_thread().name)
t = threading.Thread(target=loop, name='LoopThread')
t.start()
t.join()
print('thread %s ended.' % threading.current_thread().name)

由于任何进程默认就会启动一个线程,我们把该线程称为主线程,主线程又可以启动新的线程,Python的threading模块有个current_thread()函数,它永远返回当前线程的实例。主线程实例的名字叫MainThread,子线程的名字在创建时指定,我们用LoopThread命名子线程。名字仅仅在打印时用来显示,完全没有其他意义,如果不起名字Python就自动给线程命名为Thread-1Thread-2……

7.Lock

(1)多进程和多线程的区别:

对于多进程,每个进程都是独立的,所以变量是不共享,互不影响。而多线程由于存在一个进程之内,变量是

所有线程共享的,是会相互影响的。而线程之间共享数据最大的危险在于多个线程同时改一个变量,会把内容改乱了。

示例:多进程操作同一个变量的错误

import time, threading

# 假定这是你的银行存款:
balance = 0

def change_it(n):
    # 先存后取,结果应该为0:
    global balance
    balance = balance + n
    balance = balance - n

def run_thread(n):
    for i in range(100000):
        change_it(n)

t1 = threading.Thread(target=run_thread, args=(5,))
t2 = threading.Thread(target=run_thread, args=(8,))
t1.start()
t2.start()
t1.join()
t2.join()
print(balance)

 理论上结果永远为0,但多次执行就有可能出现错误。

(2)解决多线程的数据共享问题,就是加锁  ,也就是Lock

       当一个进程获得了锁,其它进程只有等待锁的释放。而锁只有一个,无论多少线程,同一个时刻最多只有一个线程持有该锁,所以,不会造成修改的冲突,创建一个锁就是通过threading.Lock来实现

balance = 0
lock = threading.Lock()

def run_thread(n):
    for i in range(100000):
        # 先要获取锁:
        lock.acquire()
        try:
            # 放心地改吧:
            change_it(n)
        finally:
            # 改完了一定要释放锁:
            lock.release()

当多个线程同时执行lock.acquire()时,只有一个线程能成功地获取锁,然后继续执行代码,其他线程就继续等待直到获得锁为止。

获得锁的线程用完后一定要释放锁,否则那些苦苦等待锁的线程将永远等待下去,成为死线程。所以我们用try...finally来确保锁一定会被释放。

(3)锁的优点和缺点:

锁能保证一段代码的完整执行,坏处就是组织了多线程并发执行,因为包含锁的某段代码实际上只能以单线程模式执行,效率就大大下降了。其次,由于存在多个锁,不同的线程持有不同的锁,并试图获取对方持有的锁时,可能会造成死锁,导致多个线程全部挂起,既不能执行,也无法结束,只能靠操作系统强制终止。

8.Python的多线程在多核CPU上的表现

c,c++,java在执行多核CPU测试(死循环测试)时会把所有CPU跑满,而Python不会。

因为Python的线程虽然是真正的线程,但解释器执行代码时,有一个GIL锁:Global Interpreter Lock,任何Python线程执行前,必须先获得GIL锁,然后,每执行100条字节码,解释器就自动释放GIL锁,让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁,所以,多线程在Python中只能交替执行,即使100个线程跑在100核CPU上,也只能用到1个核。

GIL是Python解释器设计的历史遗留问题,通常我们用的解释器是官方实现的CPython,要真正利用多核,除非重写一个不带GIL的解释器。

所以,在Python中,可以使用多线程,但不要指望能有效利用多核。如果一定要通过多线程利用多核,那只能通过C扩展来实现,不过这样就失去了Python简单易用的特点。

不过,也不用过于担心,Python虽然不能利用多线程实现多核任务,但可以通过多进程实现多核任务。多个Python进程有各自独立的GIL锁,互不影响。

小结

多线程编程,模型复杂,容易发生冲突,必须用锁加以隔离,同时,又要小心死锁的发生。

Python解释器由于设计时有GIL全局锁,导致了多线程无法利用多核。多线程的并发在Python中就是一个美丽的梦。

猜你喜欢

转载自blog.csdn.net/HNDX2018/article/details/88285059