一、概述

本篇文章是基于《深入理解Java虚拟机》一书的读书笔记，针对Java虚拟机在并发情况下的内存模型以及线程做了介绍，本文属于对正文的内容提炼，文章结构如下所示：

正式开始前的开胃菜
Java内存模型
从虚拟机的角度看线程

二、正式开始前的开胃菜

1. 多任务处理的必要性

多任务处理在现代计算机操作系统中几乎是一项必备的功能。让计算机同时去做几件事有以下的因素：

现在的计算机运算能力越来越强大。
计算机的运算速度与它的存储和通信子系统速度差距过大，运算能力较强的处理器不得不长时间处于等待状态造成了资源的浪费，多任务处理可以更加有效地利用这些处于空闲的处理器。
便于服务端向多个客户端提供服务。每秒事务处理数（Transactions Per Second, TPS）是用于衡量服务器性能好坏的一个重要指标，它与程序的并发能力有着密切的关系。

2. 硬件的效率与一致性

Java虚拟机的并发问题与物理计算机中的并发问题具有很高的相似性，通过物理机遇到的问题和解决方式，可以为我们接下来的正文做参考

并发目的：让计算机并发执行若干个运算任务，从而提高计算机处理器的效能。
问题：绝大多数的运算任务不可能只靠处理器完成，处理器至少要与内存进行交互，如读取运算数据、存储运算结果等，这个 IO 操作是很难消除的。但计算机的存储设备于CPU的运算速度有几个数量级的差距。
解决办法：加入一层读写速度尽可能接近处理器运算速度的告诉缓存作为内存与处理器之间的缓冲，将运算需要使用到的数据复制到缓存中，让运算能快速进行。当运算结束后再从缓存同步回内存之中。这样处理器无需等待缓慢的内存读写了。
带来的新问题：缓存一致性(Cache Coherence)。在多处理器系统中，每个处理器都有自己的高速缓存，而它们又共享同一主内存(Main Memory)。当多个处理器的运算任务都涉及到同一块主内存区域时，将导致各自的缓存数据不一致，那么同步回主内存的时候，将会造成数据的不一致性。
解决方案：为了解决数据的不一致性问题，需要各个处理器访问缓存时都遵守一些协议，这类协议有 MSI、MESI、MOSI(Illinois Protocol)、Synapse、Firefly 及 Dragon Protocol 等。

因此在现代计算机中，处理器、高速缓存及其主内存的关系图如下所示：
在这里插入图片描述

三、Java 内存模型

定义 Java内存模型（Java Memory Model, JMM）的目的：

屏蔽掉各种硬件和操作系统的内存访问差异，以实现让 Java 程序在各种平台下都达到一致的内存访问效果。

1. 主内存和工作内存

Java 内存模型将内存划分成了内存和工作内存，如下图所示：
在这里插入图片描述
可以看出 Java 内存模型和物理机的内存模型具有非常高的可比性，它的特点如下：

每条线程有自己的工作内存，线程的工作内存保存了被该线程使用到的变量的主内存副本拷贝。
线程对变量的所有操作（读取、赋值等）都必须在工作内存中进行，而不能直接读写主内存中的变量。
不同的线程之间也法直接访问对方工作内存中的变量，线程间的变量值的传递均需要通过主内存来完成。

需要注意的是这里的变量与 Java 编程中说的变量有所不同，它包括了实例字段、静态字段和构成数组对象的元素，但不包括局部变量与方法参数，因为后者是线程私有的，不会被共享。

2. 内存间交互操作

Java内存模型中定义了以下8种操作来完成主内存与工作内存之间具体的交互协议，虚拟机实现时必须保证这8种操作都是原子的、不可再分的：

操作	作用对象	作用
lock(锁定)	主内存中的变量	把一个变量标识为一条线程独占的状态
unlock(解锁)	主内存中的变量	把一个处于锁定状态的变量释放出来，释放后的变量才可以被其他线程锁定
read(读取)	主内存中的变量	把一个变量的值从主内存传输到线程的工作内存中，以便随后的load动作使用
load(载入)	工作内存的变量	把read操作从主内存中得到的变量值放入到工作内存的变量副本中
use(使用)	工作内存的变量	把工作内存中一个变量的值传递给执行引擎，每当虚拟机遇到一个需要使用到变量的字节码指令时将会执行这个操作
assign(赋值)	工作内存的变量	把一个从执行引擎接收到的值赋给工作内存的变量，每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作
store(存储)	工作内存的变量	把工作内存中一个变量的值传送到主内存中，以便随后的write操作使用
wriite(写入)	主内存中的变量	把store操作从工作内存中得到的变量的值放入到主内存的变量中

把一个变量从主内存复制到工作内存，要顺序执行 read 和 load 操作，如果要把变量从工作内存同步回主内存，要顺序执行 store 和 write 操作。顺序执行的两个操作之间可以不连续。例如从主内存中同时读入两个变量 A 和 B 到工作内存中，顺序可能为 read A、read B、load B、load A。

执行上述 8 种基本操作必须满足如下规则：

不允许 read 和 load、store 和 write 操作之一单独出现。
不允许一个线程丢弃它最近的assign操作，即变量在工作内存中改变了之后必须把该变化同步回主内存。
不允许一个线程无原因地（没有发生过任何 assign 操作）把数据从线程的工作内存同步回主内存中。
一个新的变量只能在主内存中诞生，不允许在工作内存中直接使用一个未被初始化过的变量。
一个变量在同一时刻只允许一条线程对其进行 lock 操作，但 lock 操作可以被同一条线程重复执行多次，多次执行 lock 后，只有执行相同次数的 unlock 操作，变量才会解锁。
如果对一个变量执行 lock 操作，那将会清空工作内存中此变量的值，在执行引擎使用这个变量前，需要重新执行 load 或 assign 操作初始化变量的值。
如果一个变量事先没有被 lock 操作锁定，那就不允许对它执行 unlock 操作，也不允许去 unlock 一个被其它线程锁定住的变量。
对一个变量执行 unlock 操作之前，必须先把此变量同步回主内存中（执行store、write操作）。

3. Java 内存模型的特性

Java 内存模型是围绕着并发过程中如何处理原子性、可见性和有序性这 3 个特征来建立的，下面是对它们的详细介绍：

原子性(Atomicity)：一个操作要么都执行要么都不执行。
- 由 Java内存模型来直接保证原子性变量操作包括 read、load、assign、use、store 和 write，我们可以大致认为基本数据类型的访问读写是具备原子性*（long、double除外）。
- Java内存模型还提供了 lock 和 unlock 来保证更大范围的原子性保证，这两个指令并未开放给用户使用，但是缺提供了更高层次的字节码 monitorenter 和 monitorexit 来隐式使用这两个操作，这两个字节码指令反映到 Java代码中就是 synchronized 关键字，所以在 synchronized 块中的操作也具备原子性。
可见性(Visibility)：当一个线程修改了共享变量的值，其他线程能够立即得知这个修改。
- Java 内存模型是通过在变量修改后将新值同步回主内存，在变量读取前从主内存刷新变量值这种依赖主内存作为传递媒介的方式实现可见性的，有以下三点实现方式：
  - volatile：通过 volatile 的特殊规则保证新值能够立即同步到主内存，以及每次使用前立即从主内存刷新。所以 volatile 保证了多线程操作时变量的可见性，普通变量则不能保证这一点。
  - synchronized：同步块的可见性是由“对一个变量执行 unlock 操作之前，必须先把此变量同步回主内存中”这条规则获得的。
  - final：被 final 关键字修饰的字段在构造器中一旦初始化完成，并且构造器没有把 “this” 的引用传递出去，那在其他线程就能看见 final 字段的值。
有序性(Ordering)：在本线程内观察，所有的操作都是有序的；在一个线程中观察另一个线程，所有的操作都是无序的。
- 造成这种差异主要是因为指令重排序以及工作内存与主内存的同步延迟。Java提供了以下两种方式保证线程之间操作的有序性：
  - volatile：关键字 volatile 可以禁止指令重排序优化。
  - synchronized：在同步块中，一个变量在同一时刻只允许一条线程对其进行 lock 操作。

4. 先行发生原则

先行发生是 Java内存模型中定义的两项操作之间的偏序关系，是用于判断数据是否存在竞争、线程是否安全的主要依据。Java内存模型有如下一些“天然的”先行发生关系：

程序次序规则(Program Order Rule)：在一个线程内，按照程序代码顺序，书写在前面的操作先行发生于书写在后面的操作。
管程锁定规则(Monitor Lock Rule)：一个 unlock 操作先行发生于后面对同一个锁的 lock 操作。
volatile变量规则(Volatile Variable Rule)：对一个 volatile 变量的写操作先行发生于后面对这个变量的读操作。
线程启动规则(Thread Start Rule)：Thread 对象的 start() 方法先行发生于此线程的每一个动作。
线程终止规则(Thread Termination Rule)：线程中的所有操作都先行发生于对此线程的终止检测。
线程中断规则(Thread Interruption Rule)：对线程 interrupt() 方法的调用先行发生于被中断线程的代码检测到中断事件的发生。
对象终结规则(Finalizer Rule)：一个对象的初始化完成先行发生于它的 finalize() 方法的开始。
传递性(Transitivity)：如果操作 A 先行发生于操作 B，操作 B 先行发生于操作 C，那么操作 A 先行发生与操作 C。

例子：

public class Demo {

    static class Value{
        private int value = 0;

        public int getValue() {
            return value;
        }

        public void setValue(int value) {
            this.value = value;
        }
    }

    public static void main(String[] args) {

        Value v = new Value();
        
        Thread A = new Thread(() -> {
            v.setValue(1);
        });
        
        Thread B = new Thread(() -> {
            System.out.print(v.getValue());
        });
        
        A.start();
        B.start();
    }
    
}

这段程序的打印结果是不确定的，可能为 0，也可能为 1。根据先行发生的 8 大规则逐一分析：

程序次序规则：由于赋值和取值的操作不在同一个线程中，所以该规则不适用。
管程锁定规则：两个线程所调用的方法均没有同步块，所以不适应。
volatile变量规则：变量 value 没有用关键字 volatile 修饰，同样不适用。
线程启动、终止、中断规则和对象终结规则：例子中和这几个规则都没有关系，所以都不适用。
传递性：因为没有一个适用与上述先行发生规则的关系出现，所以这条规则更是不适用。

结论：

以上先发先行原则均不使用于这段代码，所以该操作是线程不安全的。
一个操作时间上的先发生不代表这个操作会先行发生。

解决方法：

对于 setter 和 getter 方法均用 synchronized关键字修饰，这样我们这段代码就符合管程锁定规则。
由于这里的 setter 方法对 value 的修改不依赖 value 的原值，所以用 volatile 关键字修饰变量 value 同样能保证线程安全，此时这段程序就符合 volatile变量规则。

注意：时间先后顺序与先行发生原则之间基本没有太大的关系，在衡量并发安全问题是不要收到时间顺序的干扰，一切要以先行发生原则为准。

四、从虚拟机的角度看线程

1. 线程实现的三种方式

使用内核线程实现
- 内核线程（Kernel-Level Thread, KTL）：直接由操作系统内核（Kernel）支持的线程。
- 原理：内核线程由内核完成线程切换，内核通过操纵调度器（Scheduler）对线程进行调度，并负责将线程的任务映射到各个处理器上。每个内核线程都可以视为内核的一个分身。程序一般不直接使用内核线程，而是使用轻量级进程。
- 轻量级进程（Light Weight Process, LWP）：通常意义上所讲的线程，每个轻量级进程都由一个内核线程支持，与内核线程之间是 1 : 1 的关系。
  - 优点：由于内核线程的支持，每个轻量级进程都可以成为一个独立的调度单元，即使有一个轻量级进程在系统调用中阻塞了，也不会影响整个进程继续工作。
  - 缺点：由于基于内核线程的实现，创建、析构及同步等线程操作都需要进行代价较为高昂的系统调用，因此轻量级进程需要消耗一定的内核资源，同时轻量级进程数量有限。
- 轻量级进程和内核线程是一对一的对于关系，如下图所示：
使用用户线程实现
- 用户线程（User Thread, UT）：完全建立在用户空间的线程库上，系统内核不能感知线程存在的实现。
- 优点：用户线程的建立、同步、销毁和调度完全在用户态中完成，不需要消耗内核资源，因此操作是非常快速且低消耗的；可以支持规模更大的线程数量。
- 缺点：所有线程操作都需要用户程序自己处理，线程的创建、切换和调度等都是需要考虑的问题；处理诸如“阻塞如何处理”、“多处理器系统中将线程映射到其他处理器上”这类问题异常困难，甚至不可能完成。
- 进程与用户线程之间为 1: N 的关系，如下图所示：
使用用户线程加轻量级进程混合实现
- 混合实现定义：将内核线程和用户线程一起使用的实现方式，既存在用户线程，也存在轻量级进程。
- 优点：用户线程还是完全建立在用户空间中，因此用户线程的创建、切换、析构等操作依然廉价，并可支持大规模的用户线程并发。而轻量级进程则作为用户线程和内核线程之间的桥梁，从而可以利用内核提供的线程调度功能及处理器映射，并且用户线程的系统调用要通过轻量级线程完成，大大降低整个进程被完全阻塞的风险。
- 混合实现的用户线程和轻量级进程的数量比是不定的，为 N : M 的关系，即多对多的线程模型，如下图所示：

2. Java线程的实现

在 JDK1.2 之前，是基于用户线程的方式实现的；
在 JDK1.2 中，线程模型替换为基于操作系统原生线程模型来实现；
目前的 JDK 版本答案是不确定。在不同的平台上，Java虚拟机对于线程的实现都是不同的，因为不同的操作系统所支持的线程模型不同，而线程模型很大长度上决定了 Java虚拟机的线程是怎么映射的。线程模型只对线程的并发规模和操作成本产生影响，对 Java程序的编码和运行来说，这些差异都是透明的。

3. Java线程调度的两种方式

同式线程调度（Cooperative Threads-Scheduling）
- 原理：线程的执行时间由线程本身来控制，线程把自己的工作执行完之后，要主动通知系统切换到另一个线程上。
- 优点：实现简单，并且切换操作对线程自己是可知的，不存在线程同步的问题。
- 缺点：线程执行时间不可控，如果有线程一直不告知系统进行线程切换，那么程序会一直阻塞在那里。
抢占式线程调度（Preemptive Threads-Scheduling）
- 原理：线程通过系统来分配执行时间，线程的切换不由线程本身决定。Java 采用的线程调度方式就是抢占式线程调度。
- 优点：线程的执行时间是系统可控的，不会存在一个线程导致整个进程阻塞的问题。

由于 Java的线程调度是由系统自动完成的，理论上线程是不可控的。但我们可以通过给系统某种暗示来给某些线程多一些执行时间，另外一些线程则可以少分配一点——这项操作可以通过设置线程优先级来完成。

但是线程优先级并不是太靠谱，因为Java的线程是通过映射到系统的原生线程上来实现的，所以线程的调度最终还是取决于操作系统。虽然现在很多操作系统都提供了线程优先级的概念，但是并不见得与Java线程的优先级一一对应。例如对于优先级比Java线程少的系统，就不得不出现几个优先级相同的情况了。

4. 线程的五种状态

新建（New）：创建后尚未启动的线程处于新建状态。
运行（Runnable）：包括了操作系统线程状态中的 Running 和 Ready，处于此状态的线程有可能正在执行，也有可能正在等待 CPU 为其分配时间片。
无限期等待（Waiting）：该状态下的线程不会被分配 CPU 执行时间，需要等待被其他线程显示唤醒。可通过下列方法让线程进入无限期等待状态：
- 没有设置 Timeout 参数的 Object#wait() 方法。
- 没有设置 Timeout 参数的 Thread#join() 方法。
- LockSupport.park() 方法。
限期等待（Timed Waiting）：该状态下的线程同样不会被分配 CPU 执行时间，但在一定时间之后它们会由系统自行唤醒。可通过下列方法让线程进入限期等待状态：
- Thread.sleep() 方法
- 设置了 Timeout 参数的 Object#wait() 方法。
- 设置了 Timeout 参数的 Thread#join() 方法。
- LockSupport.parkNanos() 方法。
- LockSupport.parkUntil() 方法。
阻塞（Blocked）：处于阻塞状态的线程是在等待获取一个排他锁，在程序等待进入同步块时，线程处于这种状态。
结束（Terminated）：已终止线程的线程状态，线程已经结束执行。

线程之间的状态切换如下图所示：
在这里插入图片描述

五、参考

本篇文章参考自：

《深入理解Java虚拟机》
- 第五部分高效并发
  - 第12章 Java内存模型与线程

电子书资源：

链接：https://pan.baidu.com/s/1SDginxQBu90hvPeG_85epw
提取码：bftc

希望这篇文章对您有所帮助~

读书笔记 | Java 内存模型与线程