Unix环境高级编程读书笔记（线程）

1、线程的分离状态
在任何一个时间点上，线程是可结合的（joinable）或者是分离的（detached）。一个可结合的线程能够被其它线程收回其资源和杀死；在被其它线程回收之前，它的存储器资源是不释放的。相反，一个分离的线程是不能被其它线程回收或杀死的，它的存储器资源在它终止时由系统自动释放。
线程的分离状态决定一个线程以什么样的方式来终止自己，在默认情况下线程是非分离状态的，这种情况下，原有的线程等待创建的线程结束。只有当pthread_join()函数返回时，创建的线程才算终止，才能释放自己占用的系统资源。而分离线程不是这样子的，它没有被其他的线程所等待，自己运行结束了，线程也就终止了，马上释放系统资源。
注意:一个设置一个线程为分离线程,而这个线程运行又非常快,它很可能在pthread_create函数返回之前就终止了,它终止以后就可能将线程号和系统资源移交给其它的线程使用,这样调用pthread_create的线程就得到了错误的线程号.要避免这种情况可以采取一定的同步措施,最简单的方法之一是可以在被创建的线程里调用pthread_cond_timewait函数,让这个线程等待一会,留出足够的时间让函数pthread_create返回.设置一段等待时间,是在多线程编程里常用的方法.但是注意不要使用诸如wait()之类的函数,它们是使整个进程睡眠,并不能解决线程同步的问题

2、每个线程都包含有表示执行环境所必需的信息，其中包括进程中标识线程的线程ID、一组寄存器值、栈、调度优先级和策略、信号屏蔽字、errno变量以及线程私有数据，
一个进程的所有信息对该进程的所有线程都是共享的，包括可执行程序的代码、程序的全局内存和堆内存、栈以及文件描述符

3、就像每个进程有一个进程ID一样，每个线程也有一个线程ID，进程ID在整个系统中是唯一的，但线程ID不同，线程ID只有在它所属的进程上下文中才有意义
线程ID是存放在一个pthread_t结构中，对于线程ID的比较，通过函数:int pthread_equal(pthread_t tid1,pthread_t tid2);
函数：pthread_t pthread_self(void)获得自身的线程ID

4、主线程可能把工作任务放在一个队列中，用线程ID来控制每个工作线程处理哪些作业。主线程把新的作业放到一个工作队列中，由3个工作线程组成的线程池从队列中
移出作业，主线程不允许每个线程任意处理从队列顶端取出的作业，而是由主线程控制作业的分配，主线程会在每个待处理作业的结构中放置处理该作业的线程ID，每个
工作线程只能移出标有自己线程ID的作业

5、新增的线程可以通过调用pthread_create函数创建
int pthread_create(pthread_t *tidp,const pthread_attr_t *attr,void*(*start_rtn)(void*),void *arg);
当pthread_create成功返回时，新创建线程的线程ID会被设置成tidp指向的内存单元
新创建的线程从start_rtn函数的地址开始运行，如果需要向start_rtn函数传递的参数有一个以上，那么需要把这些参数放到一个结构中，然后把这个结构的地址作为arg
参数传入

6、主线程需要休眠，如果主线程不休眠，它就可能会退出，这样新线程还没有机会运行，整个进程可能就已经终止了，这种行为特征依赖于操作系统中的线程实现和调度算
法

7、如果进程中的任意线程调用了exit、_Exit或者_exit，那么整个进程就会终止，与此相类似，如果默认的动作是终止进程，那么发送到线程的信号就会终止整个进程
单个线程可以通过三种方式退出，因此可以在不终止整个进程的情况下，停止它的控制流
1）线程可以简单地从启动例程中返回，返回值是线程的退出码；
2）线程可以被同一进程中的其它线程取消；
3）线程调用pthread_exit
void pthread_exit(void *rval_ptr);//rval_ptr参数是一个无类型指针，进程中的其它线程可以通过调用pthread_join函数访问到这个指针
int pthread_join(pthread_t thread,void **rval_ptr);//调用线程将一直阻塞，直到指定的线程调用pthread_exit、从启动例程返回或者被取消，
如果线程简单地从它的启动例程返回，rval_ptr就包含返回码。如果线程被取消，由rval_ptr指定的内存单元就设置为PTHREAD_CANCELED.
可以通过调用pthread_join自动把线程置于分离状态，这样资源就可以恢复，如果线程已处于分离状态，pthread_join调用就会失败，返回EINVAL；
如果对线程的返回值并不感兴趣，那么可以把rval_ptr设置为NULL，这种情况下，调用pthread_join函数可以等待指定的线程终止，但并不获取线程的终止状态

8、线程可以通过调用int pthread_cancel(pthread_t tid)来请求取消同一进程中的其他线程；在默认情况下，pthread_cancel函数会使得由tid标识的线程的行为
表现为如同调用了参数为PTHREAD_CANCELED的pthread_exit函数，但是线程可以选择忽略取消或者控制如何被取消；
注意：pthread_cancel并不等待线程终止，它仅仅提出请求
线程可以安排它退出时需要调用的函数，这与进程在退出时可以用atexit函数安排退出是类似的，这样的函数称为线程清理处理程序，一个线程可以建立多个清理处理程序，处理程序记录在栈中，它们的执行顺序与它们注册时相反；
如果线程是通过从它的启动例程中返回而终止的话，它的清理处理程序就不会被调用了；
在默认情况下，线程的终止状态会保存直到对该线程调用pthread_join

9、线程同步用于多个控制线程共享相同的内存时，需要确保每个线程看到一致的数据视图
程序中的增量操作一般可分解为3步：
1）从内存单元读入寄存器
2）在寄存器中对变量做增量操作
3）把新的值写回内存单元

10、线程的同步方式：
1）互斥量
可以使用pthread的互斥接口来保护数据，确保同一时间只有一个线程访问数据；
互斥量从本质上说是一把锁，在访问共享资源前对互斥量进行设置（加锁），在访问完成后释放（解锁）互斥量。对互斥量进行加锁以后，任何其它试图再次对互斥量加锁
的线程都会被阻塞直到当前线程释放该互斥锁。如果释放互斥量时有一个以上的线程阻塞，那么所有该锁上的阻塞线程都会变成可运行状态，第一个变为运行的线程就可以
对互斥量加锁，其它线程就会看到互斥量依然是锁着的，只能回去再次等待它重新变为可用，在这种方式下，每次只有一个线程可以向前执行；
互斥量是用pthread_mutex_t数据类型表示的，在使用互斥变量以前，必须首先对它进行初始化，可以把它设置为常量PTHREAD_MUTEX_INITIALIZE(只适用于静态分配的互斥量)，也可以通过调用pthread_mutex_init函数进行初始化。如果动态分配互斥量（例如，通过调用malloc函数），在释放内存前需要调用pthread_mutex_destroy.
int pthread_init(pthread_mutex_t mutex,const pthread_mutexattr_t* attr);
int pthread_mutex_destroy(pthread_mutex_t *mutex);
要用默认的属性初始化互斥量，只需把attr设为NULL；
对互斥量进行加锁，需要调用pthread_mutex_lock，如果互斥量已经上锁，调用线程将阻塞到互斥量被解锁；对互斥量解锁，需要调用pthread_mutex_unlock
int pthread_mutex_lock(pthread_mutex_t* mutex);
int pthread_mutex_trylock(pthread_mutex_t *mutex);
int pthread_mutex_unlock(pthread_mutex_t *mutex);
如果线程不希望被阻塞，它可以使用pthread_mutex_trylock尝试对互斥量进行加锁。如果调用pthread_mutex_trylock时，互斥量处于未锁住状态，那么pthread_mutex_
trylock将锁住互斥量，不会出现阻塞，直接返回0。否则pthread_mutex_trylock就会失败，不能锁住互斥量，返回EBUSY

如果线程试图对同一个互斥量加锁两次，那么它自身就会陷入死锁状态，但是使用互斥量时，还有其它不太明显的方式也能产生死锁。
例如，程序中使用一个以上的互斥量时，如果允许一个线程一直占有第一个互斥量，并且在试图锁住第二个互斥量时处于阻塞状态，但是拥有第二个互斥量的线程也在
试图锁住第一个互斥量。因为两个线程都在相互请求另一个线程拥有的资源，所以这两个线程都无法向前运行，于是就产生死锁。
可以通过仔细控制互斥量加锁的顺序来避免死锁的发生。
可以先释放占有的锁，然后过一段时间再试，这种情况使用pthread_mutex_trylock接口避免死锁。如果已经占有某些锁而且pthread_mutex_trylock接口返回成功，那么就
可以前进。但是，如果不能获取锁，可以先释放已经占有的锁，做好清理工作，然后过一段时间再重新试。
如果锁的粒度太粗，就会出现很多线程阻塞等待相同的锁。这可能并不能改善并发性。如果锁的粒度太细，那么过多的锁开销会使系统性能受到影响，而且代码变得复杂。

2）读写锁
读写锁与互斥量类似，不过读写锁允许更高的并行性，互斥量要么是锁住状态，要么就是不加锁状态，而且一次只有一个线程可以对其加锁。读写锁可以有3种状态：读模式
下加锁状态，写模式下加锁状态，不加锁状态。一次只有一个线程可以占有写模式的读写锁，但是多个线程可以同时占有读模式的读写锁。
当读写锁是写加锁状态时，在这个锁被解锁之前，所有试图对这个锁加锁的线程都会被阻塞。当读写锁在读加锁状态时，所有试图以读模式对它进行加锁的线程都可以得到
访问权，但是任何希望以写模式对此锁进行加锁的线程都会阻塞，直到所有的线程释放它们的读锁为止。虽然各操作系统对读写锁的实现各不相同，但当读写锁处于读模式
锁住的状态，而这时有一个线程试图已写模式获取锁时，读写锁通常会阻塞随后的读模式锁请求。这样可以避免读模式锁长期占用，而等待的写模式锁请求一直得不到满足。
读写锁通过调用int pthread_rwlock_init(pthread_rwlock_t rwlock,const pthread_rwlockattr_t attr)进行初始化.
在释放读写锁占用的内存之前，需要调用pthread_rwlock_destroy将释放这些资源，如果在调用pthread_rwlock_destroy之前就释放了读写锁占用的内存空间，那么分配
给这个锁的资源就会丢失。
在读模式下锁定读写锁：int pthread_rwlock_rdlock(pthread_rwlock_t *rwlock);
在写模式下锁定读写锁：int pthread_rwlock_wrlock(pthread_rwlock_t *wrlock);
不管以何种方式锁住读写锁,都可以调用int pthread_rwlock_unlock(pthread_rwlock_t rwlock)进行解锁。

带有超时的读写锁：与互斥量一样，提供了带有超时的读写锁加锁函数，使应用程序在获取读写锁时避免陷入永久阻塞状态

3）条件变量
条件变量是线程可用的另一种同步机制，条件变量与互斥量一起使用时，允许线程以无竞争的方式等待特定的条件发生；
条件变量本身是由互斥量保护的，线程在改变条件状态之前必须首先锁住互斥量，可以把常量PTHREAD_COND_INITIALIZER赋给静态分配的条件变量，但是如果
条件变量是动态分配的，则需要使用pthread_cond_init函数对它进行初始化，在释放条件变量底层的内存空间之前，可以使用pthread_cond_destroy函数对条件
变量进行反初始化；
int pthread_cond_init(pthread_cond_t *cond,const pthread_condattr_t *attr);
int pthread_cond_destroy(pthread_cond_t *cond);
具体例子：
应用程序A中包含两个线程t1和t2，t1需要在bool变量test_cond为true时，才能继续执行，而test_cond的值是由t2来改变的，这种情况下，有两种编写
程序的方法；
第一种：t1定时去轮询变量test_cond，如果test_cond为false，则继续休眠，如果test_cond为true,则开始执行；
第二种：利用条件变量，t1在test_cond为false时调用cond_wait进行等待，t2在改变test_cond的值后，调用cond_signal，唤醒在等待中的t1，告诉t1 test_cond
的值变了，这样t1便可继续往下执行
第一种方案中，每次轮询时，如果t1休眠时间比较短，会导致cpu浪费很厉害；如果t1休眠时间比较长，又会导致应用逻辑处理不够及时，致使应用程序性能下降
第二种方案中，就是为了解决轮询的弊端而生的
//t1
pthread_mutex_lock(&mutex);//1
while(!test_cond)
{
pthread_cond_wait(&cond,&mutex);//2\3
}
pthread_mutex_unlock(&mutex);//4
RunThread1Func();

//t2
pthread_mutex_lock(&mutex);//5
test_cond = true;
pthread_cond_signal(&cond);
pthread_mutex_unlock(&mutex);//6
1\4\5\6都是正常的lock/unlock，2是进入pthread_cond_wait后的，pthread_cond_wait调pthread_mutex_unlock，这样做目的是为了保证t1阻塞wait后，t2获取同一把
锁mutex的时候对test_cond进行更改，3是被t1唤醒后，要退出pthread_cond_wait之前，pthread_cond_wait调用pthread_mutex_lock，这样做的目的是为了把mutex的
控制权还给调用pthread_cond_wait的线程，整个流程的时序为：
t1 lock->thread1 wiat->trhead 1 unlock(int wait)->t2 lock->t2 signal -> t2 unlock ->t1 lock(int wait) -> t1 unlock

int pthread_cond_signal(pthread_cond_t *cond);//至少能唤醒一个等待该条件的线程
int pthread_cond_broadcast(pthread_cond_t *cond);//唤醒等待该条件的所有线程

4）自旋锁
自旋锁与互斥量类似，但它不是通过休眠使进程阻塞，而是在获取锁之前一致处于忙等（不释放CPU）阻塞状态，自旋锁可用于以下情况：锁被持有的时间短而且线程并不
希望在重新调度上花费太多的成本

5）屏障
屏障是用户协调多个线程并行工作的同步机制，屏障允许每个线程等待，直到所有的合作线程都达到某一点，然后从该点继续运行，我们已经看到一种屏障，pthread_join函数就是一种屏障，允许一个线程等待，直到另一个线程退出；但是屏障对象的概念更广，它们允许任意数量的线程等待，直到所有的线程完成处理工作，而线程不需要
退出，所有线程达到屏障后可以接着工作

11、线程属性
如果对现有的某个线程的终止状态不感兴趣的话，可以使用pthread_detach函数让操作系统在线程退出时收回它所占用的资源；
如果在创建线程时，就知道不需要了解线程的终止状态，就可以修改pthread_attr_t结构中的detachstate线程属性，让线程一开始就处于分离状态

12、如果一个函数在相同的时间点可以被多个线程安全地调用，就称该函数是线程安全的，即可重入，如果一个函数对多个线程来说是可重入的，就说这个函数就是
线程安全的，但这并不能说明对信号处理程序来说该函数也是可重入的，如果函数对异步信号处理程序的重入是安全的，那么就可以说函数是异步信号安全的。

13、每个线程都有自己的信号屏蔽字，但是信号的处理是进程中所有线程共享的，这意味着单个线程可以阻止某些信号，但当某个线程修改了与某个给定信号相关
的处理行为以后，所有的线程都必须共享这个处理行为的改变；
线程可以调用sigwait等待一个或多个信号的出现

14、子进程和父进程是完全不同的进程，只要两者都没有对内存内容做出改动，父进程和子进程之间还可以共享内存页的副本；
在子进程内部，只存在一个线程，它是由父进程中调用fork的线程的副本构成的，如果父进程中的线程占有锁，子进程将同样占有这些锁，问题是子进程并不包含占有
锁的线程的副本，所以子进程没有办法直到它占有了哪些锁，需要释放哪些锁。
如果子进程从fork返回以后马上调用七种一个exec函数，就可以避免这样的问题，这种情况下，旧的地址空间就被丢弃，所以锁的状态无关紧要

Unix环境高级编程读书笔记（线程）

猜你喜欢