Unix环境高级编程读书笔记(线程)

1、线程的分离状态
在任何一个时间点上,线程是可结合的(joinable)或者是分离的(detached)。一个可结合的线程能够被其它线程收回其资源和杀死;在被其它线程回收之前,它的存储器资源是不释放的 。相反,一个分离的线程是不能被其它线程回收或杀死的,它的存储器资源在它终止时由系统自动释放。
线程的分离状态决定一个线程以什么样的方式来终止自己,在默认情况下线程是非分离状态的,这种情况下,原有的线程等待创建的线程结束。只有当pthread_join()函数返回时,创建的线程才算终止,才能释放自己占用的系统资源。而分离线程不是这样子的,它没有被其他的线程所等待,自己运行结束了,线程也就终止了,马上释放系统资源。
注意:一个设置一个线程为分离线程,而这个线程运行又非常快,它很可能在pthread_create函数返回之前就终止了,它终止以后就可能将线程号和系统资源移交给其它的线程使用,这样调用pthread_create的线程就得到了错误的线程号.要避免这种情况可以采取一定的同步措施,最简单的方法之一是可以在被创建的线程里调用pthread_cond_timewait函数,让这个线程等待一会,留出足够的时间让函数pthread_create返回.设置一段等待时间,是在多线程编程里常用的方法.但是注意不要使用诸如wait()之类的函数,它们是使整个进程睡眠,并不能解决线程同步的问题


2、每个线程都包含有表示执行环境所必需的信息,其中包括进程中标识线程的线程ID、一组寄存器值、栈、调度优先级和策略、信号屏蔽字、errno变量以及线程私有数据,
一个进程的所有信息对该进程的所有线程都是共享的,包括可执行程序的代码、程序的全局内存和堆内存、栈以及文件描述符


3、就像每个进程有一个进程ID一样,每个线程也有一个线程ID,进程ID在整个系统中是唯一的,但线程ID不同,线程ID只有在它所属的进程上下文中才有意义
线程ID是存放在一个pthread_t结构中,对于线程ID的比较,通过函数:int pthread_equal(pthread_t tid1,pthread_t tid2);
函数:pthread_t pthread_self(void)获得自身的线程ID


4、主线程可能把工作任务放在一个队列中,用线程ID来控制每个工作线程处理哪些作业。主线程把新的作业放到一个工作队列中,由3个工作线程组成的线程池从队列中
移出作业,主线程不允许每个线程任意处理从队列顶端取出的作业,而是由主线程控制作业的分配,主线程会在每个待处理作业的结构中放置处理该作业的线程ID,每个
工作线程只能移出标有自己线程ID的作业


5、新增的线程可以通过调用pthread_create函数创建
int pthread_create(pthread_t *tidp,const pthread_attr_t *attr,void*(*start_rtn)(void*),void *arg);
当pthread_create成功返回时,新创建线程的线程ID会被设置成tidp指向的内存单元
新创建的线程从start_rtn函数的地址开始运行,如果需要向start_rtn函数传递的参数有一个以上,那么需要把这些参数放到一个结构中,然后把这个结构的地址作为arg
参数传入


6、主线程需要休眠,如果主线程不休眠,它就可能会退出,这样新线程还没有机会运行,整个进程可能就已经终止了,这种行为特征依赖于操作系统中的线程实现和调度算



7、如果进程中的任意线程调用了exit、_Exit或者_exit,那么整个进程就会终止,与此相类似,如果默认的动作是终止进程,那么发送到线程的信号就会终止整个进程
单个线程可以通过三种方式退出,因此可以在不终止整个进程的情况下,停止它的控制流
1)线程可以简单地从启动例程中返回,返回值是线程的退出码;
2)线程可以被同一进程中的其它线程取消;
3)线程调用pthread_exit
void pthread_exit(void *rval_ptr);//rval_ptr参数是一个无类型指针,进程中的其它线程可以通过调用pthread_join函数访问到这个指针
int pthread_join(pthread_t thread,void **rval_ptr);//调用线程将一直阻塞,直到指定的线程调用pthread_exit、从启动例程返回或者被取消,
如果线程简单地从它的启动例程返回,rval_ptr就包含返回码。如果线程被取消,由rval_ptr指定的内存单元就设置为PTHREAD_CANCELED.
可以通过调用pthread_join自动把线程置于分离状态,这样资源就可以恢复,如果线程已处于分离状态,pthread_join调用就会失败,返回EINVAL;
如果对线程的返回值并不感兴趣,那么可以把rval_ptr设置为NULL,这种情况下,调用pthread_join函数可以等待指定的线程终止,但并不获取线程的终止状态


8、线程可以通过调用int pthread_cancel(pthread_t tid)来请求取消同一进程中的其他线程;在默认情况下,pthread_cancel函数会使得由tid标识的线程的行为
表现为如同调用了参数为PTHREAD_CANCELED的pthread_exit函数,但是线程可以选择忽略取消或者控制如何被取消;
注意:pthread_cancel并不等待线程终止,它仅仅提出请求
线程可以安排它退出时需要调用的函数,这与进程在退出时可以用atexit函数安排退出是类似的,这样的函数称为线程清理处理程序,一个线程可以建立多个清理处理程序,处理程序记录在栈中,它们的执行顺序与它们注册时相反;
如果线程是通过从它的启动例程中返回而终止的话,它的清理处理程序就不会被调用了;
在默认情况下,线程的终止状态会保存直到对该线程调用pthread_join


9、线程同步用于多个控制线程共享相同的内存时,需要确保每个线程看到一致的数据视图
程序中的增量操作一般可分解为3步:
1)从内存单元读入寄存器
2)在寄存器中对变量做增量操作
3)把新的值写回内存单元


10、线程的同步方式:
1)互斥量
可以使用pthread的互斥接口来保护数据,确保同一时间只有一个线程访问数据;
互斥量从本质上说是一把锁,在访问共享资源前对互斥量进行设置(加锁),在访问完成后释放(解锁)互斥量。对互斥量进行加锁以后,任何其它试图再次对互斥量加锁
的线程都会被阻塞直到当前线程释放该互斥锁。如果释放互斥量时有一个以上的线程阻塞,那么所有该锁上的阻塞线程都会变成可运行状态,第一个变为运行的线程就可以
对互斥量加锁,其它线程就会看到互斥量依然是锁着的,只能回去再次等待它重新变为可用,在这种方式下,每次只有一个线程可以向前执行;
互斥量是用pthread_mutex_t数据类型表示的,在使用互斥变量以前,必须首先对它进行初始化,可以把它设置为常量PTHREAD_MUTEX_INITIALIZE(只适用于静态分配的互斥量),也可以通过调用pthread_mutex_init函数进行初始化。如果动态分配互斥量(例如,通过调用malloc函数),在释放内存前需要调用pthread_mutex_destroy.
int pthread_init(pthread_mutex_t mutex,const pthread_mutexattr_t* attr);
int pthread_mutex_destroy(pthread_mutex_t *mutex);
要用默认的属性初始化互斥量,只需把attr设为NULL;
对互斥量进行加锁,需要调用pthread_mutex_lock,如果互斥量已经上锁,调用线程将阻塞到互斥量被解锁;对互斥量解锁,需要调用pthread_mutex_unlock
int pthread_mutex_lock(pthread_mutex_t* mutex);
int pthread_mutex_trylock(pthread_mutex_t *mutex);
int pthread_mutex_unlock(pthread_mutex_t *mutex);
如果线程不希望被阻塞,它可以使用pthread_mutex_trylock尝试对互斥量进行加锁。如果调用pthread_mutex_trylock时,互斥量处于未锁住状态,那么pthread_mutex_
trylock将锁住互斥量,不会出现阻塞,直接返回0。否则pthread_mutex_trylock就会失败,不能锁住互斥量,返回EBUSY


如果线程试图对同一个互斥量加锁两次,那么它自身就会陷入死锁状态,但是使用互斥量时,还有其它不太明显的方式也能产生死锁。
例如,程序中使用一个以上的互斥量时,如果允许一个线程一直占有第一个互斥量,并且在试图锁住第二个互斥量时处于阻塞状态,但是拥有第二个互斥量的线程也在
试图锁住第一个互斥量。因为两个线程都在相互请求另一个线程拥有的资源,所以这两个线程都无法向前运行,于是就产生死锁。
可以通过仔细控制互斥量加锁的顺序来避免死锁的发生。
可以先释放占有的锁,然后过一段时间再试,这种情况使用pthread_mutex_trylock接口避免死锁。如果已经占有某些锁而且pthread_mutex_trylock接口返回成功,那么就
可以前进。但是,如果不能获取锁,可以先释放已经占有的锁,做好清理工作,然后过一段时间再重新试。
如果锁的粒度太粗,就会出现很多线程阻塞等待相同的锁。这可能并不能改善并发性。如果锁的粒度太细,那么过多的锁开销会使系统性能受到影响,而且代码变得复杂。


2)读写锁
读写锁与互斥量类似,不过读写锁允许更高的并行性,互斥量要么是锁住状态,要么就是不加锁状态,而且一次只有一个线程可以对其加锁。读写锁可以有3种状态:读模式
下加锁状态,写模式下加锁状态,不加锁状态。一次只有一个线程可以占有写模式的读写锁,但是多个线程可以同时占有读模式的读写锁。
当读写锁是写加锁状态时,在这个锁被解锁之前,所有试图对这个锁加锁的线程都会被阻塞。当读写锁在读加锁状态时,所有试图以读模式对它进行加锁的线程都可以得到
访问权,但是任何希望以写模式对此锁进行加锁的线程都会阻塞,直到所有的线程释放它们的读锁为止。虽然各操作系统对读写锁的实现各不相同,但当读写锁处于读模式
锁住的状态,而这时有一个线程试图已写模式获取锁时,读写锁通常会阻塞随后的读模式锁请求。这样可以避免读模式锁长期占用,而等待的写模式锁请求一直得不到满足。
读写锁通过调用int pthread_rwlock_init(pthread_rwlock_t rwlock,const pthread_rwlockattr_t attr)进行初始化.
在释放读写锁占用的内存之前,需要调用pthread_rwlock_destroy将释放这些资源,如果在调用pthread_rwlock_destroy之前就释放了读写锁占用的内存空间,那么分配
给这个锁的资源就会丢失。
在读模式下锁定读写锁:int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock);
在写模式下锁定读写锁:int pthread_rwlock_wrlock(pthread_rwlock_t *wrlock);
不管以何种方式锁住读写锁,都可以调用int pthread_rwlock_unlock(pthread_rwlock_t rwlock)进行解锁。


带有超时的读写锁:与互斥量一样,提供了带有超时的读写锁加锁函数,使应用程序在获取读写锁时避免陷入永久阻塞状态


3)条件变量
条件变量是线程可用的另一种同步机制,条件变量与互斥量一起使用时,允许线程以无竞争的方式等待特定的条件发生;
条件变量本身是由互斥量保护的,线程在改变条件状态之前必须首先锁住互斥量,可以把常量PTHREAD_COND_INITIALIZER赋给静态分配的条件变量,但是如果
条件变量是动态分配的,则需要使用pthread_cond_init函数对它进行初始化,在释放条件变量底层的内存空间之前,可以使用pthread_cond_destroy函数对条件
变量进行反初始化;
int pthread_cond_init(pthread_cond_t *cond,const pthread_condattr_t *attr);
int pthread_cond_destroy(pthread_cond_t *cond);
具体例子:
应用程序A中包含两个线程t1和t2,t1需要在bool变量test_cond为true时,才能继续执行,而test_cond的值是由t2来改变的,这种情况下,有两种编写
程序的方法;
第一种:t1定时去轮询变量test_cond,如果test_cond为false,则继续休眠,如果test_cond为true,则开始执行;
第二种:利用条件变量,t1在test_cond为false时调用cond_wait进行等待,t2在改变test_cond的值后,调用cond_signal,唤醒在等待中的t1,告诉t1 test_cond
的值变了,这样t1便可继续往下执行
第一种方案中,每次轮询时,如果t1休眠时间比较短,会导致cpu浪费很厉害;如果t1休眠时间比较长,又会导致应用逻辑处理不够及时,致使应用程序性能下降
第二种方案中,就是为了解决轮询的弊端而生的
//t1
pthread_mutex_lock(&mutex);//1
while(!test_cond)
{
pthread_cond_wait(&cond,&mutex);//2\3
}
pthread_mutex_unlock(&mutex);//4
RunThread1Func();


//t2
pthread_mutex_lock(&mutex);//5
test_cond = true;
pthread_cond_signal(&cond);
pthread_mutex_unlock(&mutex);//6
1\4\5\6都是正常的lock/unlock,2是进入pthread_cond_wait后的,pthread_cond_wait调pthread_mutex_unlock,这样做目的是为了保证t1阻塞wait后,t2获取同一把
锁mutex的时候对test_cond进行更改,3是被t1唤醒后,要退出pthread_cond_wait之前,pthread_cond_wait调用pthread_mutex_lock,这样做的目的是为了把mutex的
控制权还给调用pthread_cond_wait的线程,整个流程的时序为:
t1 lock->thread1 wiat->trhead 1 unlock(int wait)->t2 lock->t2 signal -> t2 unlock ->t1 lock(int wait) -> t1 unlock


int pthread_cond_signal(pthread_cond_t *cond);//至少能唤醒一个等待该条件的线程
int pthread_cond_broadcast(pthread_cond_t *cond);//唤醒等待该条件的所有线程




4)自旋锁
自旋锁与互斥量类似,但它不是通过休眠使进程阻塞,而是在获取锁之前一致处于忙等(不释放CPU)阻塞状态,自旋锁可用于以下情况:锁被持有的时间短而且线程并不
希望在重新调度上花费太多的成本


5)屏障
屏障是用户协调多个线程并行工作的同步机制,屏障允许每个线程等待,直到所有的合作线程都达到某一点,然后从该点继续运行,我们已经看到一种屏障,pthread_join函数就是一种屏障,允许一个线程等待,直到另一个线程退出;但是屏障对象的概念更广,它们允许任意数量的线程等待,直到所有的线程完成处理工作,而线程不需要
退出,所有线程达到屏障后可以接着工作


11、线程属性
如果对现有的某个线程的终止状态不感兴趣的话,可以使用pthread_detach函数让操作系统在线程退出时收回它所占用的资源;
如果在创建线程时,就知道不需要了解线程的终止状态,就可以修改pthread_attr_t结构中的detachstate线程属性,让线程一开始就处于分离状态


12、如果一个函数在相同的时间点可以被多个线程安全地调用,就称该函数是线程安全的,即可重入,如果一个函数对多个线程来说是可重入的,就说这个函数就是
线程安全的,但这并不能说明对信号处理程序来说该函数也是可重入的,如果函数对异步信号处理程序的重入是安全的,那么就可以说函数是异步信号安全的。


13、每个线程都有自己的信号屏蔽字,但是信号的处理是进程中所有线程共享的,这意味着单个线程可以阻止某些信号,但当某个线程修改了与某个给定信号相关
的处理行为以后,所有的线程都必须共享这个处理行为的改变;
线程可以调用sigwait等待一个或多个信号的出现


14、子进程和父进程是完全不同的进程,只要两者都没有对内存内容做出改动,父进程和子进程之间还可以共享内存页的副本;
在子进程内部,只存在一个线程,它是由父进程中调用fork的线程的副本构成的,如果父进程中的线程占有锁,子进程将同样占有这些锁,问题是子进程并不包含占有
锁的线程的副本,所以子进程没有办法直到它占有了哪些锁,需要释放哪些锁。
如果子进程从fork返回以后马上调用七种一个exec函数,就可以避免这样的问题,这种情况下,旧的地址空间就被丢弃,所以锁的状态无关紧要

猜你喜欢

转载自blog.csdn.net/metheir/article/details/70242394