〖C++11〗线程库详解

「前言」文章是关于C++11线程库相关的

「归属专栏」C嘎嘎

「笔者」枫叶先生(fy)

「座右铭」前行路上修真我

「枫叶先生有点文青病」

「每篇一句」

 请不要把陌生人的些许善意,

视为珍稀的瑰宝,

却把身边亲近人的全部付出,

当做天经地义的事情,

对其视而不见 
 ——烽火戏诸侯《剑来》

目录

一、简介

二、线程库(thread)

三、互斥量库(mutex)

四、原子性操作库(atomic)

五、条件变量库(condition_variable)

六、实现两个线程交替打印


一、简介

在C++11之前,涉及到多线程问题,都是和平台相关的,比如 windows 和 linux 下各有自己的接口,这使得代码的可移植性比较差。C++11中最重要的特性就是对线程进行支持了,使得C++在并行编程时不需要依赖第三方库,而且在原子操作中还引入了原子类的概念。

C++11大致增加了五个库,其中常见的有:线程库(thread)、互斥量库(mutex)、原子性操作库(atomic)、条件变量库(condition_variable)

二、线程库(thread)

要使用标准库中的线程,必须包含 <thread> 头文件,thread的文档介绍:thread

成员函数有以下:

构造函数如下:

​ 

  1. 第一个是无参的构造函数,调用无参的构造函数创建出来的线程对象没有关联任何线程函数,即没有启动任何线程
  2. 第二个是带参的构造函数,调用带参的构造函数创建线程对象,能够将线程对象与线程函数fn进行关联
  3. 第三个是拷贝构造函数,线程是禁止拷贝的
  4. 第四个是移动构造函数,能够使用一个右值线程对象来构造一个线程对象

thread中常用的成员函数介绍如下:

 使用无参的构造函数

thread() noexcept;

 注:noexcept表示该函数不会抛异常

创建一个无参的线程如下:

thread t1;

调用无参的构造函数创建出来的线程对象没有关联任何线程函数,即没有启动任何线程。

thread提供了移动赋值函数,后续需要让该线程对象与线程函数关联时,可以使用带参的方式创建一个匿名对象,然后调用移动赋值将该匿名对象关联线程的状态转移给该线程对象,例如:

void func(int n)
{
	for (int i = 0; i < n; i++)
	{
		cout << i << endl;
	}
}
int main()
{
	thread t1;//无参构造

	t1 = thread(func, 20);//匿名对象移动赋值

	t1.join();//线程等待
	cout << "等待成功" << endl;
	return 0;
}

无参构造使用场景:在线程池中就是首先需要先创建一批线程,但一开始这些线程什么也不做,当有任务到来时再让这些线程来处理这些任务

带参的构造函数

template <class Fn, class... Args>
explicit thread (Fn&& fn, Args&&... args);

 参数:

  • fn:可调用对象,比如函数指针、仿函数、lambda表达式、被包装器包装后的可调用对象等
  • args:调用可调用对象fn时所需要的若干参数

当创建一个线程对象后,并且给线程关联线程函数,该线程就被启动,与主线程一起运行。线程函数一般情况下可按照以下三种方式提供:函数指针、lambda表达式、函数对象
 

void ThreadFunc(int a)
{
	cout << "Thread1  " << a << endl;
}
class TF
{
public:
	void operator()()
	{
		cout << "Thread3" << endl;
	}
};
int main()
{
	// 线程函数为函数指针
	thread t1(ThreadFunc, 10);

	// 线程函数为lambda表达式
	thread t2([] {cout << "Thread2" << endl; });

	// 线程函数为函数对象
	TF tf;
	thread t3(tf);

	t1.join();
	t2.join();
	t3.join();

	cout << "Main thread!" << endl;
	return 0;
}

运行结果

 

移动构造函数 

thread (thread&& x) noexcept;

 thread提供了移动构造函数,能够用一个右值线程对象来构造一个线程对象

void func(int n)
{
	for (int i = 0; i < n; i++)
	{
		cout << i << endl;
	}
}
int main()
{
	thread t3 = thread(func, 10);

	t3.join();
	return 0;
}

注意:

  • thread类是防拷贝的,不允许拷贝构造以及赋值,但是可以移动构造和移动赋值,即将一个线程对象关联线程的状态转移给其他线程对象,转移期间不意向线程的执行

可以通过jionable()函数判断线程是否是有效的,如果是以下任意情况,则线程无效:

  • 采用无参构造函数构造的线程对象
  • 线程对象的状态已经转移给其他线程对象
  • 线程已经调用jion或者detach结束

还有一个要注意:获取线程id(get_id)

 调用thread的成员函数get_id以获取线程的id,但该方法必须通过线程对象来调用get_id函数,如果要在线程对象关联的线程函数中获取线程id,必须要使用 this_thread::get_id(),this_thread是一个命名空间

例如:

void func()
{
	cout << this_thread::get_id() << endl; //获取线程id
}
int main()
{
	thread t(func);

	t.join();
	return 0;
}

该命名空间下有四个函数,文档介绍

线程函数参数问题 

线程函数的参数是以值拷贝的方式拷贝到线程栈空间中的,因此:即使线程参数为引用类型,在线程中修改后也不能修改外部实参,因为其实际引用的是线程栈中的拷贝,而不是外部实参 

void ThreadFunc1(int x)
{
	x++;
}
int main()
{
	int a = 10;
	// 在线程函数中对a修改,不会影响外部实参
	thread t1(ThreadFunc1, a);
	t1.join();
	cout << a << endl;
	
	return 0;
}

 如果要通过线程函数的形参改变外部的实参,可以参考以下三种方式:借助std::ref函数、地址的拷贝、lambda表达式

void ThreadFunc1(int& x)
{
	x++;
}
void ThreadFunc2(int* x)
{
	*x += 10;
}
int main()
{
	int a = 10;

	// 如果想要通过形参改变外部实参时,必须借助std::ref()函数
	thread t2(ThreadFunc1, std::ref(a));
	t2.join();
	cout << a << endl;

	// 地址的拷贝
	thread t3(ThreadFunc2, &a);
	t3.join();
	cout << a << endl;

	return 0;
}

运行结果

 

启动一个线程后,当这个线程退出时,需要对该线程所使用的资源进行回收,否则可能会导致内存泄露等问题。hread库给我们提供了如下两种回收线程资源的方式:线程等待(join)、线程分离(detach) 

三、互斥量库(mutex)

要使用互斥量,必须包含 <mutex> 头文件,mutex文档介绍:mutex

mutex的种类 

在C++11中,Mutex总共包了四个互斥量的种类
 

std::mutex 

C++11提供的最基本的互斥量,该类的对象之间不能拷贝,也不能进行移动。mutex最常用的三个函数

注意,线程函数调用lock()时,可能会发生以下三种情况:

  • 如果该互斥量当前没有被锁住,则调用线程将该互斥量锁住,直到调用 unlock之前,该线程一直拥有该锁
  • 如果当前互斥量被其他线程锁住,则当前的调用线程被阻塞住
  • 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)

线程函数调用try_lock()时,可能会发生以下三种情况

  • 如果当前互斥量没有被其他线程占有,则该线程锁住互斥量,直到该线程调用 unlock释放互斥量
  • 如果当前互斥量被其他线程锁住,则当前调用线程返回 false,而并不会被阻塞掉
  • 如果当前互斥量被当前调用线程锁住,则会产生死锁(deadlock)

std::recursive_mutex

 其允许同一个线程对互斥量多次上锁(即递归上锁),来获得对互斥量对象的多层所有权,释放互斥量时需要调用与该锁层次深度相同次数的 unlock(),除此之外,std::recursive_mutex 的特性和 std::mutex 大致相同

std::timed_mutex

特性和 std::mutex 大致相同,timed_mutex 比 std::mutex 多了两个成员函数,try_lock_for(),try_lock_until()

try_lock_for()

  • 接受一个时间范围,表示在这一段时间范围之内线程如果没有获得锁则被阻塞住(与std::mutex 的 try_lock() 不同,try_lock 如果被调用时没有获得锁则直接返回false),如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false

try_lock_until()

  • 接受一个时间点作为参数,在指定时间点未到来之前线程如果没有获得锁则被阻塞住,如果在此期间其他线程释放了锁,则该线程可以获得对互斥量的锁,如果超时(即在指定时间内还是没有获得锁),则返回 false

std::recursive_timed_mutex

recursive_timed_mutex就是recursive_mutex和timed_mutex的结合,recursive_timed_mutex既支持在递归函数中进行加锁操作,也支持定时尝试申请锁

加锁示例 

int ThreadProc()
{
	for (int i = 0; i < 100; i++)
	{
		g_lock.lock();//加锁
		++number;
		cout << "thread 1 :" << number << endl;
		g_lock.unlock();//解锁
	}
	return 0;
}

int main()
{
	thread t1(ThreadProc);
	thread t2(ThreadProc);
	t1.join();
	t2.join();
	cout << "number:" << number << endl;
	
	return 0;
}

在多线程环境下,如果想要保证某个变量的安全性,只要将其设置成对应的原子类型即可,即高效又不容易出现死锁问题。但是有些情况下,我们可能需要保证一段代码的安全性,那么就只能通过锁的方式来进行控制

锁控制不好时,可能会造成死锁,最常见的比如在锁中间代码返回,或者在锁的范围内抛异常。因此:C++11采用RAII的方式对锁进行了封装,即lock_guardunique_lock

 lock_guard

std::lock_gurad 是 C++11 中定义的模板类。定义如下:

template<class _Mutex>
class lock_guard
{
public:
	// 在构造lock_gard时,_Mtx还没有被上锁
	explicit lock_guard(_Mutex& _Mtx)
		: _MyMutex(_Mtx)
	{
		_MyMutex.lock();
	}
	// 在构造lock_gard时,_Mtx已经被上锁,此处不需要再上锁
	lock_guard(_Mutex& _Mtx, adopt_lock_t)
		: _MyMutex(_Mtx)
	{}
	~lock_guard() _NOEXCEPT
	{
		_MyMutex.unlock();
	}
	lock_guard(const lock_guard&) = delete;
	lock_guard& operator=(const lock_guard&) = delete;
private:
	_Mutex& _MyMutex;
};

 lock_guard类模板主要是通过RAII的方式,对其管理的互斥量进行了封装,在需要加锁的地方,只需要用上述介绍的任意互斥体实例化一个lock_guard,调用构造函数成功上锁,出作用域前,lock_guard对象要被销毁,调用析构函数自动解锁,可以有效避免死锁问题。

lock_guard的缺陷:太单一,用户没有办法对该锁进行控制,因此C++11又提供了unique_lock

模拟实现lock_guard

namespace fy
{
	template<class Mutex>
	class lock_guard
	{
	public:
		lock_guard(Mutex& mtx)
			:_mtx(mtx)
		{
			mtx.lock(); //加锁
		}
		~lock_guard()
		{
			mtx.unlock(); //解锁
		}
		lock_guard(const lock_guard&) = delete;
		lock_guard& operator=(const lock_guard&) = delete;
	private:
		Mutex& _mtx;
	};
}

 unique_lock

与lock_gard类似,unique_lock类模板也是采用RAII的方式对锁进行了封装,并且也是以独占所有权的方式管理mutex对象的上锁和解锁操作,即其对象之间不能发生拷贝。

  • 在构造(或移动(move)赋值)时,unique_lock 对象需要传递一个 Mutex 对象作为它的参数,
  • 新创建的 unique_lock 对象负责传入的 Mutex 对象的上锁和解锁操作。
  • 使用以上类型互斥量实例化unique_lock的对象时,自动调用构造函数上锁,
  • unique_lock对象销毁时自动调用析构函数解锁,可以很方便的防止死锁问题。

 与lock_guard不同的是,unique_lock更加的灵活,提供了更多的成员函数:

  • 上锁/解锁操作:lock、try_lock、try_lock_for、try_lock_until和unlock
  • 修改操作:移动赋值、交换(swap:与另一个unique_lock对象互换所管理的互斥量所有权)、释放(release:返回它所管理的互斥量对象的指针,并释放所有权)
  • 获取属性:owns_lock(返回当前对象是否上了锁)、operator bool()(与owns_lock()的功能相同)、mutex(返回当前unique_lock所管理的互斥量的指针)

四、原子性操作库(atomic)

多线程最主要的问题是共享数据带来的问题(即线程安全)。如果共享数据都是只读的,那么没问题,因为只读操作不会影响到数据,更不会涉及对数据的修改,所以所有线程都会获得同样的数据。但是,当一个或多个线程要修改共享数据时,就会产生很多潜在的麻烦。

文档介绍:<atomic> - C++ Reference (cplusplus.com) 

比如:

unsigned long sum = 0;
void fun(size_t num)
{
	for (size_t i = 0; i < num; ++i)
		sum++;
}
int main()
{
	cout << "Before joining,sum = " << sum << std::endl;
	thread t1(fun, 10000000);
	thread t2(fun, 10000000);
	t1.join();
	t2.join();
	cout << "After joining,sum = " << sum << std::endl;
	return 0;
}

上述代码中分别让两个线程对同一个变量n进行了10000000次++操作,理论上最终n的值应该是20000000,但最终打印出n的值却是小于200000的

C++98中传统的解决方式:可以对共享修改的数据可以加锁保护

unsigned long sum = 0L;
void fun(size_t num)
{
	for (size_t i = 0; i < num; ++i)
	{
		m.lock();
		sum++;
		m.unlock();
	}
}
int main()
{
	cout << "Before joining,sum = " << sum << std::endl;
	thread t1(fun, 10000000);
	thread t2(fun, 10000000);
	t1.join();
	t2.join();
	cout << "After joining,sum = " << sum << std::endl;
	return 0;
}

虽然加锁可以解决,但是加锁有一个缺陷就是:只要一个线程在对sum++时,其他线程就会被阻塞,会影响程序运行的效率,而且锁如果控制不好,还容易造成死锁

因此C++11中引入了原子操作。所谓原子操作:即不可被中断的一个或一系列操作,C++11引入的原子操作类型,使得线程间数据的同步变得非常高效

注意:需要使用以上原子操作变量时,必须添加头文件 <atomic>

修改上面的代码,使用原子性操作

atomic_long sum = { 0 };
void fun(size_t num)
{
	for (size_t i = 0; i < num; ++i)
		sum++; // 原子操作
}
int main()
{
	cout << "Before joining, sum = " << sum << std::endl;
	thread t1(fun, 1000000);
	thread t2(fun, 1000000);
	t1.join();
	t2.join();
	cout << "After joining, sum = " << sum << std::endl;
	return 0;
}

注意: 需要用大括号对原子类型的变量进行初始化。

在C++11中,程序员不需要对原子类型变量进行加锁解锁操作,线程能够对原子类型变量互斥的访问。

更为普遍的,程序员可以使用atomic类模板,定义出需要的任意原子类型

atmoic<T> t; // 声明一个类型为T的原子类型变量t

注意:

  • 原子类型通常属于"资源型"数据,多个线程只能访问单个原子类型的拷贝,因此在C++11中,原子类型只能从其模板参数中进行构造,不允许原子类型进行拷贝构造、移动构造以及operator=等,为了防止意外,标准库已经将atmoic模板类中的拷贝构造、移动构造、赋值运算符重载默认删除掉了

五、条件变量库(condition_variable)

condition_variable文档介绍:condition_variable - C++ Reference (cplusplus.com)

condition_variable中提供的成员函数,可分为wait系列和notify系列两类。

wait系列成员函数的作用就是让调用线程进行阻塞等待,notify系列成员函数的作用就是唤醒等待的线程

注:条件变量是配合互斥量使用的

wait函数提供了两个不同版本的接口:

 

wait: 

  • 调用第一个版本的wait函数时只需要传入一个互斥锁,线程调用wait后会立即被阻塞,直到被唤醒。
  • 调用第二个版本的wait函数时除了需要传入一个互斥锁,还需要传入一个返回值类型为bool的可调用对象,与第一个版本的wait不同的是,当线程被唤醒后还需要调用传入的可调用对象,如果可调用对象的返回值为false,那么该线程还需要继续被阻塞

notify: 

  • notify_one:唤醒等待队列中的首个线程,如果等待队列为空则什么也不做
  • notify_all:唤醒等待队列中的所有线程,如果等待队列为空则什么也不做

六、实现两个线程交替打印

实现两个线程交替打印,一个打印奇数,一个打印偶数

int main()
{
	int n = 100;
	mutex mtx;
	condition_variable condv;
	bool flag = true;

	//奇数
	thread t1([&] {
		int i = 1;
		while (i <= 100)
		{
			unique_lock<mutex> ul(mtx);
			condv.wait(ul, [&flag]()->bool {return flag; }); //等待条件变量满足
			cout << this_thread::get_id() << ":" << i << endl;
			i += 2;
			flag = false;
			condv.notify_one(); //唤醒条件变量下等待的一个线程
		}
		});

	//偶数
	thread t2([&] {
		int j = 2;
		while (j <= 100)
		{
			unique_lock<mutex> ul(mtx);
			condv.wait(ul, [&flag]()->bool {return !flag; }); //等待条件变量满足
			cout << this_thread::get_id() << ":" << j << endl;
			j += 2;
			flag = true;
			condv.notify_one(); //唤醒条件变量下等待的一个线程
		}
		});

	t1.join();
	t2.join();
	return 0;
}

注:线程库(thread)、互斥量库(mutex)、原子性操作库(atomic)、条件变量库(condition_variable)在Linux有类似详细解释,这里不再详细解释 

--------------------- END ----------------------

「 作者 」 枫叶先生
「 更新 」 2023.5.22
「 声明 」 余之才疏学浅,故所撰文疏漏难免,
          或有谬误或不准确之处,敬请读者批评指正。

猜你喜欢

转载自blog.csdn.net/m0_64280701/article/details/130692736