Pyhton多线程

在了解多线程前先给大家介绍下并发和并行：

　　并发：多个任务一起执行在多任务之间快速切换处理任务数量大于cpu核数

　　并行：一个cpu核处理一个任务，多个cpu核同时处理多个任务任务数量等于或者小于cpu核数

再介绍下同步和异步：

　　同步：指线程在访问某一资源时，获得了资源的返回结果之后才会执行其他操作（先做某件事，再做某件事）

　　异步：与同步相对，是指线程在访问某一资源时，无论是否取得返回结果，都进行下一步操作；当有了资源返回结果时系统自会通知线程

在Python中，使用threading库来创建多线程

import threading


def func1():
    for i in range(6):
        time.sleep(1)


def func2():
    for i in range(5):
        time.sleep(1)


# 创建线程对象
t2 = threading.Thread(target=func2)  # target = 方法名
t1 = threading.Thread(target=func1, name='线程1')  # 可以设置线程名字
# start 启动线程活动
# join([time]) 设置主线程会等待time秒后再往下执行，time默认为子线程结束，多个子线程之间设置的值会增加
# isAlive 返回线程是否活动的
# getName（） 返回线程名
# setName() 设置线程名

a = time.time()
t2.start()  # 开始执行线程2
t1.start()  # 开始执行线程1
# 让主线程等待子线程执行完后再继续往下执行 同步的概念
t2.join()
t1.join()
b = time.time()
c = b - a
print(c)

threading.currentThread()  # 返回当前执行的线程
threading.enumerate()  # 返回正在运行的所有线程（list） 正在运行指：启动后、结束前，不包括了启动前和终止后的线程
threading.activeCount()  # 返回正在运行的线程数量

在threading库中调用start方法后，start方法调用了他内部的run()方法，我们可以通过继承threading重写run()方法来批量创建线程，代码如下

import threading
import requests
import time


# 通过继承 threading 类来创建线程 重写run方法  因为start方法调用的就是run 重写run
class MyClass(threading.Thread):
    def __init__(self, url):
        self.url = url
        super().__init__()  # 如果要传入参数重写init方法时，一定要调用父类的init方法

    # 发送requests请求

    def run(self):
        res = requests.get(self.url)
        print('线程{},返回{}'.format(threading.current_thread(), res.status_code))


t1 = time.time()
for i in range(5):
    t = MyClass('https://www.baidu.com')
    t.start()
t.join()
t2 = time.time()
print(t2 - t1)

可以通过直接实例化类来创建线程对象，如果要传入参数，在重写init方法时要注意在最后调用父类的init方法，具体原因可以去查看thrreading库是如何实现的，在init方法中有很多其他的代码需要执行。

多线程共享全局变量：

在python中是使用单核来处理线程的，也就是并发并非并行，代码示例如下：

import threading

a = 100


def func1():
    for i in range(100000):
        global a
        a += 1
    print(a)


def func2():
    for i in range(100000):
        global a
        a += 1
    print(a)


t1 = threading.Thread(func1())
t2 = threading.Thread(func2())
t1.start()
t2.start()

当执行func1()方法时，获取全局变量为100，此时暂停切换到func2()方法，获取全局变量a为100，并进入for循环，当a循环到20000时（举例），又切换到func1()方法中开始执行for循环，此时在func1()中a的值为100，循环1次后把a的值又更新为101,造成数据不准确。

解决这个问题会用到互斥锁、同步、队列，在下一篇会给大家讲到

猜你喜欢