(二)JAVA内存模型:解决可见性和有序性问题

JAVA内存模型简介

上篇文章已知,导致可见性的原因是缓存,导致有序性的原因是编译优化,那解决可见性、有序性最直接的方法就是禁用缓存和编译优化,这样虽然问题解决了,但是性能可能差强人意。

合理的方案应该是按需禁用缓存以及编译优化。那么,如何做到“按需禁用”呢?对于并发程序,何时禁用缓存以及编译优化只有程序员知道,那所谓“按需禁用”其实就是指按照程序员的要求来禁用。所以,为了解决可见性有序性问题,只需要提供给程序员按需禁用缓存和编译优化的方法即可

Java内存模型:规范了JVM如何提供按需禁用缓存和编译优化的方法。

具体说,这些方法包括volatilesynchronized 和 final 三个关键字,以及七项 Happens-Before 规则。

 

Volatile关键字简介

volatile 最原始的意义就是禁用 CPU 缓存。例如,我们声明一个 volatil e变量 volatile int x = 0,它表达的是:告诉编译器,对这个变量的读写,不能使用 CPU 缓存,必须从内存中读取或者写入。如上篇中利用双重检索单例一下,可以使用 volatile static Singleton instance 解决 instance 的可见性和有序性问题。

例如下面的示例代码:

假设线程 A 执行 writer() 方法,按照 volatile 语义,会把变量 “v=true” 写入内存;

假设线程 B 执行 reader() 方法,同样按照 volatile 语义,线程 B 会从内存中读取变量 v,如果线程 B 看到 “v == true” 时,那么线程 B 看到的变量 x 是多少呢?

直觉上看,应该是 42,那实际应该是多少呢?这个要看 Java 的版本,如果在低于 1.5 版本上运行,x 可能是 42,也有可能是 0;如果在 1.5 以上的版本上运行,x 就是等于 42。

 
class VolatileExample {
  int x = 0;
  volatile boolean v = false;
  public void writer() {
    x = 42;
    v = true;
  }
  public void reader() {
    if (v == true) {
      // 这里x会是多少呢?
    }
  }
}
分析一下,为什么 1.5 以前的版本会出现 x = 0 的情况呢?我相信你一定想到了,变量 x 可能被 CPU 缓存而导致可见性问题。这个问题在 1.5 版本已经被圆满解决了。Java 内存模型在 1.5 版本对 volatile 语义进行了增强。怎么增强的呢?答案是一项 Happens-Before 规则。

Happens-Before规则

Happens-Before 规则所表达的意思是:前面一个操作的结果对后续操作都是可见的。Happens-Before 规则保证了线程之间的心灵感应,约束了编译器的优化行为,虽允许编译器优化,但是要求编译器优化后一定遵循 Happens-Before 规则。Happens-Before 规则是 Java 内存模型里面最晦涩的内容,和程序员相关的规则一共如下六项,都是关于可见性的。

 
class VolatileExample {
  int x = 0;
  volatile boolean v = false;
  public void writer() {
    x = 42;
    v = true;
  }
  public void reader() {
    if (v == true) {
      // 这里 x 会是多少呢?
    }
  }
}

1)程序的顺序性规则

程序的顺序性规则是指在一个线程中,按照程序顺序,前面的操作可见于后续的任意操作。如上面代码,按照程序的顺序, x = 42 Happens-Before 可见于 v = true,这就是规则1的内容:程序前面对某个变量的修改一定是对后续操作可见的。

2)volatile 变量规则

这条规则是指对一个 volatile 变量的写操作,Happens-Before 可见于后续对这个 volatile 变量的读操作。乍一看,这个规则有点禁用缓存的意思,但看这个规则,的确是这样,但是如果关联规则 3,就有点不一样了。

3)传递性

这条规则是指如果 A Happens-Before B 且 B Happens-Before C,那么 A Happens-Before C

从图中,我们可以看到:

  1. x = 42 Happens-Before 可见于写变量 v = true 这是规则1的内容;
  2. 写变量 v = true Happens-Before 可见于读变量 v =true 这是规则2的内容
  3. 根据这个传递性的规则,x = 42 Happens-Before 可见于读变量 v = true

总之,如果线程 B 读到了 v = true,那么线程A设置的 x = 42 对线程 B 是可见的,这就是1.5版本对 volatile 语义的增强,1.5版本的并发工具包(java.util.concurrent)就是靠volatile语义来搞定可见性的。

4)管程中锁的规则

这条规则是指对一个锁的解锁 Happens-Before 可见于后续对这个锁的加锁。管程是一种通用的同步原语,在 Java 中指的就是synchronized,synchronized 是 Java 里对管程的实现。管程中的锁在 Java 里是隐式实现的,例如下面的代码,在进入同步块之前,会自动加锁,而在代码块执行完会自动释放锁,加锁以及释放锁都是编译器帮我们实现的。

synchronized (this) { // 此处自动加锁
  // x 是共享变量, 初始值 =10
  if (this.x < 12) {
    this.x = 12; 
  }  
} // 此处自动解锁
所以结合规则 4——管程中锁的规则,可以这样理解:假设 x 的初始值是 10,线程 A 执行完代码块后 x 的值会变成 12(执行完自动释放锁),线程 B 进入代码块时,能够看到线程 A 对 x 的写操作,也就是线程 B 能够看到 x==12。这个也是符合我们直觉的,应该不难理解。

5)线程 start() 规则

这条是关于线程启动的,指的是主线程 A 启动子线程B后,子线程 B 能够看到主线程在启动子线程 B 前的操作。也就是如果线程A调用线程 B 的 start() 方法(即在线程 A 中启动线程 B),那么该 start() 操作 Happens-Before 可见于子线程B中的任意操作。

Thread B = new Thread(()->{
  // 主线程调用 B.start() 之前
  // 所有对共享变量的修改,此处皆可见
  // 此例中,var==77
});
// 此处对共享变量 var 修改
var = 77;
// 主线程启动子线程
B.start();

6)线程 join() 规则

这条是关于线程等待的,它是指线程 A 等待子线程 B 完成(主线程 A 通过调用子线程 B 的join() 方法实现),当子线程 B 完后后(主线程 A 中的 join() 方法返回),主线程能够看到子线程的操作。换句话说就是,如果在线程 A 中,调用线程 B 的join() 并成功返回,那么线程 B 中的任意操作 Happens-Before 可见于该 join() 操作的返回。

Thread B = new Thread(()->{
  // 此处对共享变量 var 修改
  var = 66;
});
// 例如此处对共享变量修改,
// 则这个修改结果对线程 B 可见
// 主线程启动子线程
B.start();
B.join()
// 子线程所有对共享变量的修改
// 在主线程调用 B.join() 之后皆可见
// 此例中,var==66

4. 被我们忽视的 final

前面我们讲 volatile 为的是禁用缓存以及编译优化,我们再从另外一个方面来看,有没有办法告诉编译器优化得更好一点呢?这个可以有,就是 final 关键字。final 修饰变量时,初衷是告诉编译器:这个变量生而不变,可以可劲儿优化。

问题类似于上一期提到的利用双重检查方法创建单例,构造函数的错误重排导致线程可能看到final变量的值会变化。详细的案例可以参考这个文档

当然了,在1.5以后Java内存模型对final类型变量的重排进行了约束。现在只要我们提供正确构造函数没有“逸出”,就不会出问题了。

“逸出”有点抽象,我们还是举个例子吧,在下面例子中,在构造函数里面将this赋值给了全局变量global.obj,这就是“逸出”,线程通过global.obj读取x是有可能读到0的。因此我们一定要避免“逸出”。

// 以下代码来源于【参考1】
final int x;
// 错误的构造函数
public FinalFieldExample() { 
  x = 3;
  y = 4;
  // 此处就是讲this逸出,
  global.obj = this;
}

 

总结

在Java语言里面,Java 内存模型里面,最晦涩的部分就是 Happens-Before 规则了,Happens-Before 的语义本质上是一种可见性,A Happens-Before B 意味着 A 事件对 B 事件来说是可见的,无论A 事件和B 事件是否发生在同一个线程里。例如A 事件发生在线程1上,B 事件发生在线程2上, Happens-Before 规则保证线程2上能看到A事件的发生。

既然 Happens-Before 规则是最晦涩的部分,那我们就来简单总结一下 Happens-Before 六项原则:

  1. 程序的顺序性规则:指在一个线程中,按照程序顺序,前面的操作可见于后续的任意操作;
  2. Volatie 变量规则:指对一个 volatile 变量的写操作,Happens-Before 可见于后续对这个 volatile 变量的读操作;
  3. 传递性:指如果 A Happens-Before B 且 B Happens-Before C,那么 A Happens-Before C;
  4. 管程中锁的规则:指对一个锁的解锁 Happens-Before 可见于后续对这个锁的加锁
  5. 线程 start() 规则:指的是主线程 A 启动子线程B后,子线程 B 能够看到主线程在启动子线程 B 前的操作
  6. 线程 join()规则:指线程 A 等待子线程 B 完成(主线程 A 通过调用子线程 B 的join() 方法实现),当子线程 B 完后后(主线程 A 中的 join() 方法返回),主线程能够看到子线程的操作。

思考

有一个共享变量abc,在一个线程里设置了abc 的值 abc = 3,思考一下,有哪些办法可以让其他线程能够看到 abc = 3?

  1. 保证共享变量的可见性,使用volatile关键字修饰。
  2. 使用synchronized关键字对 abc = 3 代码块解锁,由于 Happens-Before 管程锁的规则,使得后续的线程能够看到 abc 的值。
  3. A 线程启动后,使用A.join() 方法来完成运行,后续线程启动,则一定能看到 abc = 3。
  4. 使用原子变量,如AtomicInteger。

猜你喜欢

转载自blog.csdn.net/lss446937072/article/details/112688826