深入学习Java多线程——并发机制底层实现原理(1)

Java代码在编译后会变成Java字节码，字节码被类加载器加载到JVM里，JVM执行字节码，最终需要转化为汇编指令在CPU上执行，Java中所使用的并发机制依赖于JVM的实现和CPU的指令。建议先对Java并发的内存模型进行了解。

对于并发编程的底层实现，必须要保证实现三大特性：

可见性：即多个线程访问同一个变量时，一个线程修改了这个变量的值，其他线程能够立即看得到修改的值。

原子性：一个操作或者多个操作要么全部执行并且执行的过程不会被任何因素打断，或者一旦中断就都不执行。

有序性：程序执行的顺序按照代码的先后顺序执行。

1.volatile

在多线程并发编程中synchronized和volatile都扮演着重要的角色，volatile是轻量级的synchronized，它在多处理器开发中保证了共享变量的“可见性”。可见性的意思是当一个线程修改一个共享变量时，另外一个线程能读到这个修改的值。如果volatile变量修饰符使用恰当的话，它比synchronized的使用和执行成本更低，因为它不会引起线程上下文的切换和调度。

推荐博客：

http://www.importnew.com/24082.html

http://www.cnblogs.com/dolphin0520/p/3920373.html

1.1实现原理

实现可见性的底层原理，可通过观察Java代码与汇编代码查看。

Java代码：

instance = new Singleton(); // instance是volatile变量

汇编代码：

0x01a3de1d: movb $0×0,0×1104800(%esi);
0x01a3de24: lock addl $0×0,(%esp);

有volatile变量修饰的共享变量进行写操作的时候会多出第二行汇编代码，Lock前缀的指令在多核处理器下会引发了两件事情：

（1）将当前处理器缓存行的数据写回到系统内存。

（2）这个写回内存的操作会使在其他CPU里缓存了该内存地址的数据无效。

原本为了提高处理速度，处理器不直接和内存进行通信，而是先将系统内存的数据读到内部缓存后再进行操作，但操作完不知道何时会写到内存。

但是，如果对声明了volatile的变量进行写操作，JVM就会向处理器发送一条Lock前缀的指令，将这个变量所在缓存行的数据写回到系统内存。同时还有一个问题，就算写回到内存，如果其他处理器缓存的值还是旧的，再执行计算操作就会有问题。所以，在多处理器下，为了保证各个处理器的缓存是一致的，就会实现缓存一致性协议，每个处理器通过嗅探在总线上传播的数据来检查自己缓存的值是不是过期了，当处理器发现自己缓存行对应的内存地址被修改，就会将当前处理器的缓存行设置成无效状态，当处理器对这个数据进行修改操作的时候，会重新从系统内存中把数据读到处理器缓存里。

我个人理解就是：在多核处理器中，每个处理器处理计算一个线程的（任务）代码，比如说一个四核处理器，有一个核正在处理一个包含对共享变量进行更改赋值的操作的线程，另外三个处理器处理一个包含读取同一个共享变量操作的线程。

如果该共享变量不是volatile，首先，CPU会从系统内存中获取数据到CPU缓存中进行相应的处理，当处理对共享变量进行更改赋值的操作完成后，并不会立即将处理后的数据写回系统内存，而是直到此线程（所有代码）执行完毕后，这就可能会导致当某个赋值操作完成（即更改操作的那行代码执行）后，另一个读取共享变量的线程会读到错误数据，或者说脏数据。

如果该共享变量是volatile的，那么CPU会从系统内存中获取数据到CPU缓存中进行相应的处理，当处理对共享变量进行更改赋值的操作（即更改操作的那行代码执行）完成后，会立即将处理后的数据写回系统内存，并且其他三个处理器通过缓存一致性协议检查自己缓存的数据是否过期，是则会重新从系统内存读取。

简单来说，volatile的两条实现原则是：

（1）Lock前缀的汇编指令会引起处理器缓存回写到内存

（2）一个处理器的缓存回写到内存会导致其他处理器的缓存无效。

2.synchronized

2.1 实现原理

（1）synchronized实现同步的基础：Java中的每一个对象都可以作为锁。具体表现为以下3种形式。

对于普通同步方法，锁是当前实例对象。
对于静态同步方法，锁是当前类的Class对象。
对于同步方法块，锁是Synchonized括号里配置的对象。当一个线程试图访问同步代码块时，它首先必须得到锁，退出或抛出异常时必须释放锁。

当一个线程试图访问synchronized同步代码块时，它首先必须得到锁，退出或抛出异常时必须释放锁。那么这个锁是什么？存储在那里？

（2） Synchonized在JVM里的实现原理：JVM基于进入和退出Monitor对象来实现方法同步和代码块同步，但两者的实现细节不一样。代码块同步是使用monitorenter 和monitorexit指令实现的，而方法同步是使用另外一种方式实现的，细节在JVM规范里并没有详细说明。但是，方法的同步同样可以使用这两个指令来实现。 monitorenter指令是在编译后插入到同步代码块的开始位置，而monitorexit是插入到方法结束处和异常处，JVM要保证每个monitorenter必须有对应的monitorexit与之配对。任何对象都有一个monitor与之关联，当且一个monitor被持有后，它将处于锁定状态。线程执行到monitorenter指令时，将会尝试获取对象所对应的monitor的所有权，即尝试获得对象的锁。synchronized用的锁是存在Java对象头里的。

（3）对象头

https://blog.csdn.net/yinbucheng/article/details/70037521

2.2 锁的升级与对比

为了减少获得锁和释放锁带来的性能消耗，引入了“偏向锁”和“轻量级锁”。锁一共有4种状态，级别从低到高依次是：无锁状态、偏向锁状态、轻量级锁状态和重量级锁状态，这几个状态会随着竞争情况逐渐升级。锁可以升级但不能降级，意味着偏向锁升级成轻量级锁后不能降级成偏向锁。这种锁升级却不能降级的策略，目的是为了提高获得锁和释放锁的效率。

1.偏向锁

大多数情况下，锁不仅不存在多线程竞争，而且总是由同一线程多次获得，为了让线程获得锁的代价更低而引入了偏向锁。当一个线程访问同步块并获取锁时，会在对象头和栈帧中的锁记录里存储锁偏向的线程ID，以后该线程在进入和退出同步块时不需要进行CAS操作来加锁和解锁，只需简单地测试一下对象头的Mark Word里是否存储着指向当前线程的偏向锁。如果测试成功，表示线程已经获得了锁。如果测试失败，则需要再测试一下Mark Word中偏向锁的标识是否设置成1（表示当前是偏向锁）：如果没有设置，则使用CAS竞争锁；如果设置了，则尝试使用CAS将对象头的偏向锁指向当前线程。

（1）偏向锁的撤销

偏向锁使用了一种等到竞争出现才释放锁的机制，所以当其他线程尝试竞争偏向锁时，持有偏向锁的线程才会释放锁。偏向锁的撤销，需要等待全局安全点（在这个时间点上没有正在执行的字节码）。它会首先暂停拥有偏向锁的线程，然后检查持有偏向锁的线程是否活着，如果线程不处于活动状态，则将对象头设置成无锁状态；如果线程仍然活着，拥有偏向锁的栈会被执行，遍历偏向对象的锁记录，栈中的锁记录和对象头的Mark Word要么重新偏向于其他线程，要么恢复到无锁或者标记对象不适合作为偏向锁，最后唤醒暂停的线程。

（2）关闭偏向锁：偏向锁在Java 6和Java 7里是默认启用的，但是它在应用程序启动几秒钟之后才激活，如有必要可以使用JVM参数来关闭延迟：-XX:BiasedLockingStartupDelay=0。如果你确定应用程序里所有的锁通常情况下处于竞争状态，可以通过JVM参数关闭偏向锁：-XX:- UseBiasedLocking=false，那么程序默认会进入轻量级锁状态。

2.轻量级锁

（1）轻量级锁加锁：线程在执行同步块之前，JVM会先在当前线程的栈桢中创建用于存储锁记录的空间，并将对象头中的Mark Word复制到锁记录中，官方称为Displaced Mark Word。然后线程尝试使用 CAS将对象头中的Mark Word替换为指向锁记录的指针。如果成功，当前线程获得锁，如果失败，表示其他线程竞争锁，当前线程便尝试使用自旋来获取锁。

（2）轻量级锁解锁：轻量级解锁时，会使用原子的CAS操作将Displaced Mark Word替换回到对象头，如果成功，则表示没有竞争发生。如果失败，表示当前锁存在竞争，锁就会膨胀成重量级锁。

因为自旋会消耗CPU，为了避免无用的自旋（比如获得锁的线程被阻塞住了），一旦锁升级成重量级锁，就不会再恢复到轻量级锁状态。当锁处于这个状态下，其他线程试图获取锁时，都会被阻塞住，当持有锁的线程释放锁之后会唤醒这些线程，被唤醒的线程就会进行新一轮的夺锁之争。

3.各级别锁的优缺点对比