深入理解java虚拟机----第十三章线程安全与锁优化

这一部分和java并发编程实战中讲的很多东西一样，所以可以对照着看。

13.1 概述

对于这部分的主题“高效并发”来讲，首先需要保证并发的正确性，然后在此基础上实现高效。本章先从如何保证并发的正确性和如何实现线程安全讲起。

13.2 线程安全

当多个线程访问一个对象时，如果不用考虑这些线程在运行时环境下的调度和交替执行，也不需要进行额外的同步，或者在调用方法进行任何其他的协调操作，调用这个对象的行为都可以获得正确的结果，那么这个对象是线程安全的。

13.2.1 java语音中的线程安全

这里讨论的线程安全，就限定于多个线程之间存在共享数据访问的这个前提。

按照线程安全的“安全程度”由强到弱排序，可以把Java中各个操作共享的数据分为以下5类：

1 不可变

不可变（Immutable）的对象一定是线程安全的。

如果共享数据是一个基本数据类型，定义时使用final关键字修饰可保证它不可变。

如果共享数据是一个对象，那就需要保证对象的行为不会对其状态产生任何影响才行。其中最简单的是把对象中带有状态的变量都声明为final，这样在构造函数结束后，它就是不可变的。

Java API中符合不可变要求的类型：java.lang.String/java.lang.Number部分子类等。

2 绝对线程安全

一个类要想达到绝对线程安全，需要做到无论什么时候，都不需要额外的同步措施。这需要很大很大的代价。大多Java API标记的线程安全类，都不是绝对线程安全。比如Vector，它的get、add、size等方法都是被synchronized修饰的，单独调用时是安全的，但以一些特殊顺序调用一系列的方法时，就不安全了。

3 相对线程安全

对一个对象的一个单独操作是线程安全的。例如Vector、HashTable等。

4 线程兼容

本身不安全，通过同步手段可以达到安全的目的。Java API中大多数都是这类的。

5 线程对立

无论是否同步，都不能在多线程中并发使用。suspend和resume等。

13.2.2 线程安全的实现方法

1 互斥同步

互斥同步（Mutual Exclusion & Synchronization）是常见的一种并发正确性保障手段。同步是指在多个线程并发访问共享数据时，保证共享数据在同一个时刻只被一个（或者是一些，使用信号量的时候）线程使用。而互斥是实现同步的一种手段，临界区（Critical Section）、互斥量（MuTex）和信号量（Semaphore）都是主要的互斥实现方式。因此，在这四个字里面，互斥是因，同步是果；互斥是方法，同步是目的。

在Java中，最基本的互斥同步手段是synchronized关键字，synchronized关键字经过编译后，会在同步代码块的前后分别形成monitorenter和monitorexit这两个字节码指令，这两个字节码都需要一个reference类型的参数来指明要锁定和解锁的对象。如果程序中synchronized指明了对象参数，那就是这个对象的reference；如果没有指明，那就根据synchronized修饰的是实例方法还是类方法，去取对应的对象实例或Class对象来作为锁对象。

虚拟机规范要求，在执行monitorenter指令时，首先尝试获取对象的锁。如果对象没有被锁定或者当前线程已经拥有了那么对象的锁，把锁的计数器加1，执行monitorexit时，将锁计数减1，当锁计数器为0时，锁被释放。如果获取对象锁失败，当前线程将阻塞等待。

虚拟机对monitorenter和monitorexit行为描述中，注意两点：synchronized同步块对同一条线程来说是可重入的，不会出现自己把自己锁死的问题；同步块在已进入线程执行完之前，会阻塞后面其他线程的进入。

还可以使用java.util.concurrent（以下称JUC）包中的重入锁（ReentrantLock）来实现同步。相比synchronized，ReentrantLock增加了一些高级功能，主要以下3项：等待可中断、可实现公平锁，以及锁可以绑定多个条件。

等待可中断：当持有的锁的线程长期不释放锁时，正在等待的线程可以选择放弃等待，改为处理其他事情，对处理执行时间长的同步块很有帮助。

公平锁：多个线程等待同一锁时，必须按照申请锁的时间顺序来依次获得锁；而非公平锁不保证这一点，在锁被释放时，任何一个等待锁的线程都有机会获得锁。synchronized中的锁是非公平的，ReentrantLock默认也是非公平，但可以通过构造函数要求使用公平锁。

绑定多个条件：一个ReentrantLock对象可以同时绑定多个Condition对象，而synchronized中，锁对象的wait()和notify()或notifyAll()可以实现一个隐含的条件，如果要和多于一个的条件关联时，就不得不额外添加一个锁，而ReentrantLock则无须这样，只要多次调用newCondition()即可。

2.非阻塞同步

互斥同步最主要的问题就是进行线程阻塞和唤醒所带来的性能问题，因此这种同步也称为阻塞同步（Blocking Synchronized）。处理问题方式上，互斥同步属于一种悲观的并发策略，总是认为只要不去做正确的同步措施（例如加锁），那肯定会出现问题，无论共享数据是否真的出现竞争，它都要进行加锁（这里讨论的是概念模型，实际上虚拟机会优化很大一部分不必要的加锁）、用户态核心态转换、维护锁计数器和检查是否有阻塞的线程需要等待唤醒等操作。

随着硬件指令集的发展，有了另外一种选择：基于冲突检测的乐观并发策略，就是先进性操作，如果没有其他线程争用共享数据，那操作就成功了；如果共享数据有争，产生了冲突，那就再采取其他的补偿措施（最常见的补偿措施就是不断地重试，直到成功为止），这种乐观的并发策略的许多实现都不需要把线程挂起，因此这种同步称为非阻塞同步（Non-Blocking Synchronization）。

我们需要操作和冲突检测这两个步骤具备原子性，只能靠硬件来完成，硬件保证一个从语义上看起来需要多次操作的行为只通过一条处理器指令就能完成，这类执行常用的有：

测试并设置（Test and Set）。

获取并增加（Fetch and Increment）。

交换（Swap）。

比较并交换（Compare and Swap，以下称CAS）。

加载链接/条件存储（Load Linked/Store Conditional，以下称LL/SC）。

3.无同步方案

要保证线程安全，并不是一定就要进行同步，两者并没有因果关系。同步只是保证共享数据争用时正确性的手段，如果一个方法本来就不涉及共享数据，自然就无须任何同步措施去保证正确定。因此会有一些代码天生就是线程安全的。两类：

可重入代码（Reentrant Code）：这种代码也叫纯代码（Pure Code），可以在代码执行的任何时刻中断它，转而去执行另外一断代码（包括递归调用它本身），而在控制权返回后，原来的程序不会出现任何错误。所有可重入代码都是线程安全的。可重入代码有一些共同特征，例如不依赖存储在堆上的数据和公用的系统资源、用到的状态量都是由参数中传入、不调用非可重入的方法等。判断代码具备可重入的简单原则：如果一个方法，它的返回结果是可以预测的，只要输入了相同的数据，就都能返回相同的结果，就满足可重入性的要求，当然也是线程安全的。

线程本地存储（Thread Local Storage）：如果一段代码中所需要的数据必须与其他代码共享，那就看这些共享数据的代码是否能保证在同一个线程中执行？如能，就把共享数据的可见性范围限制在同一个线程之内，这样，就无须同步也能保证线程之前不出现数据争用问题。

符合这种特点的应用：大部分使用消费队列的架构模式（如“生产者-消费者”模式）都会讲消费过程尽量在一个线程中消费完；经典Web交互模型中的“一个请求对应一个服务线程”（Thread-per-Request）的处理方式，这种处理方式的广泛应用使得很多Web服务端应用都可以使用线程本地存储来解决线程安全问题。

Java中，如果一个变量要被多个线程访问，可以使用volatile关键字声明它为“易变的”；如果一个变量被某个线程独享，可以通过java.lang.ThreadLocal类来实现线程本地存储的功能。每一个线程的Thread对象中都有一个ThreadLcoalMap对象，该对象存储了一组易ThreadLocal.threadLocalHashCode为键，以本地线程变量为值得K-V键值对，ThreadLocal对象就是当前线程的ThreadLocalMap的访问入口，每一个ThreadLocal对象都包含了一个独一无二的threadLocalHashCode值，使用这个值就可以在线程K-V键值对中找回对应的本地线程变量。

13.3 锁优化

自旋锁：线程的挂起和恢复代价很大，自旋锁让竞争锁的线程自循环等待一会，看不能不能很快获得锁。省去了线程切换代价，但是自循环白白消耗cpu，所以它会自适应，收集数据判断等待是否值得，默认循环10次，如果预测值得就会加大次数，如果预测不值得，可能会直接挂起。

锁消除：利用逃逸分析的结果，去掉不必要的锁

锁粗化：如果小范围内频繁对一个对象加锁、释放锁，开销很大，会将锁范围扩大，用更少量的锁代替，减少开销。

轻量级锁：传统锁使用互斥量实现，开销大。它的目的是在没有多线程竞争的前提下，减少传统锁的开销。前面的对象内存布局中提到过，HotSpot对象头会存储运行时信息Mark Word，其中就包括锁信息。如果线程发现对象当前没有被锁定，将会在栈桢建立一个名为锁记录的空间，存储当前锁对象的Mark Word拷贝，然后用CAS尝试将对象头中的这部分改为指向该锁记录的指针。如果成功了，就获得了锁，并将Mark Word标记为轻量级锁定状态。如果失败了，看占有锁的是不是这个线程本身，是的话，可以继续执行，不是的话，说明产生竞争了，轻量级锁将会膨胀为重量级锁。释放锁同样CAS。可以看出，如果没有多线程竞争，大大提升性能，但是如果竞争出现，在传统锁基础上又绕远了一圈。

偏向锁：目的是消除无竞争下的锁原语，进一步提升性能。轻量级锁是用CAS代理互斥量，偏向所是全去掉都不要了。锁偏向于获得它的线程，会在Mark Work中存储获得它的线程id，每次发现还是这个线程id就什么都不需要做，直接放行。如果产生竞争，可能重偏向或膨胀为轻量级锁。