Java虚拟机高效并发之Java内存模型

Java Memory Model，JMM，什么是Java内存模型？

Java虚拟机试图定义一种Java内存模型来屏蔽掉各种硬件和操作系统的内存访问差异，以实现让Java程序在各种平台下都能达到一致的内存访问效果（Java跨平台语言）。

一、物理机中的内存模型

“让计算机并发执行若干个计算任务”与“更充分的利用计算机处理器的效能”之间的因果关系，看起来顺理成章，实际并非如此，绝大多数的运算任务并不仅仅依赖处理器“计算”就可以完成，处理器至少要与内存交互，如读取运算数据，存储运算结果，这个I/O操作是很难消除的（无法仅靠寄存器完成所有的计算任务），且计算机存储设备与处理器的运算速度有几个数量级的差距，为了“高效”，现代计算机系统加入一层读写速度尽可能接近处理器运算速度的高效缓存（Cache）来作为内存与处理器之间的缓冲，将运算需要使用的数据复制到缓存中，让运算快速进行，将运算的结果同步回内存中，这样，处理器就无需再等在缓慢的内存读写了。

“基于高速缓存的存储交互”很好的解决了处理器与内存的速度矛盾，但同样也带来了一个“缓存一致性”的新问题。即在多处理器系统中，每个处理器都有自己的高速缓存，而它们又共享同一主内存，当多个处理器的运算任务都涉及到同一块主内存区域时，将可能导致各自的缓存数据不一致。为了解决这一问题，需要各个处理器访问缓存时都需要一些协议，在读写的时候都要遵循协议来操作。

除了增加高速缓存之外，为了使处理器内部的运算单元尽可能被充分利用，处理器可能会对输入代码进行乱序执行优化（Out-Of-Order Execution）,处理器会在计算之后将乱序执行的结果重组，保证该结果与顺序执行的结果是一致的，但不保证程序中各个语句计算的先后顺序与输入代码中的顺序一致。因此，如果一个计算任务依赖于另一个计算任务的结果，那其顺序就不能依靠代码的顺序来保证。（Java虚拟机的即时编译器也有类似的指令重排优化）

二、Java内存模型

定义Java内存模型并不是一件容易的事情，这个模型必须定义的足够严谨，才能让Java的并发内存访问操作不会产生歧义，但是，也必须定义的足够宽松，使得虚拟机的实现有足够的自由空间去利用硬件的各种特性（寄存器、高速缓存和指令集中某些特有的指令）来获取更好的执行速度。JDK1.5后，Java内存模型已经成熟和完善。

三、主内存与工作内存

扫描二维码关注公众号，回复： 437332 查看本文章

JMM的主要目标是定义程序中各个变量的访问规则，即在虚拟机中将变量存储到内存和从内存中取出变量这样的底层细节。此处的变量包含了实例字段，静态字段和构成数组对象的元素，但不包括局部变量与方法参数，因为后者为线程私有，不会被共享，就不会存在竞争问题。为了获取更好的执行效能，JMM并没有限制执行引擎使用处理器的特定寄存器或缓存来和主内存进行交互，也没有限制即时编译器进行执行重排这类优化措施。

JMM中规定所有的变量都存储在主内存（Main Memory）中（类比物理计算机内存模型，此处主内存仅仅是虚拟机内存的一部分）。每条线程都有自己的工作内存（Working Memory，类比物理计算机的高速缓存），线程的工作内存中存储着该线程使用到的变量的主内存副本拷贝（并不会拷贝整个对象，这个对象的引用、对象中某个在线程访问到的字段是有可能拷贝的），线程对变量的所有操作（读取load、赋值assign），而不能直接读写主内存中的变量。不同的线程之间无法直接访问对方工作内存中变量，，线程间变量值的传递需依赖主内存来完成。线程，工作内存，主内存的交互关系图如下：

说道此处，回忆一下Java虚拟机自动内存管理机制中内存的划分，如果非要将虚拟机的内存换分与JMM对应起来，主内存主要对应于Java堆中的对象实例数据部分，工作内存则对应虚拟机栈中的部分区域。为了获取更好的运行速度，虚拟机可能会让工作内存优先存储于寄存器和高速缓存中，因为程序运行时，主要访问读写的是工作内存。

三、内存间交互操作

第一部分提到了物理机中多处理器的缓存一致性协议，那么JMM中同样也有主内存与工作内存的交互协议，即一个变量如何从主内存拷贝到工作内存、如何从工作内存同步回主内存之类的实现细节，JMM定义了8种操作，虚拟机实现时，必须保证下面的每一种操作都是原子的、不可再分的。

①lock（锁定）：作用于主内存变量，它把一个变量标识为一条线程独占的状态。

②unlock（解锁）：作用于主内存变量，它把一个处于锁定状态的变量释放出来，释放后的变量才可以被其他线程锁定。

③read（读取）：作用于主内存变量，它把一个变量的值从主内存传输到线程的工作内存中，以便随后的load个动作。

④load（载入）：作用于工作内存变量，它把read操作从主内存得到的变量值放入工作内存的变量副本中。

⑤use（使用）：作用于工作内存变量，它把工作内存中一个变量值传递给执行引擎，每当虚拟机遇到一个需要使用到变量值的字节码指令时会执行这个操作。

⑥assign（赋值）：作用于工作内存变量，它把一个从执行引擎的接收到的值赋给工作内存的变量，每当虚拟机遇到一个赋值的字节码指令时执行这个操作。

⑦store（存储）：作用于工作内存变量，它把工作内存中的一个变量的值传送到主内存中，以便随后的write操作使用。

⑧write（写入）：作用于主内存的变量，它把store操作从工作内存中得到的变量值放入主内存变量中。

如果要把一个变量从主内存复制到工作内存中，那就需要顺序的执行read和load操作，如果要把一个变量从工作内存同步回主内存中，就要顺序的执行store和write操作，注意，JMM中只要求上述操作按顺序执行，但不要求一定要连续执行，所以read、load操作，store、write操作之间可以插入其他指令。除此之外，JMM在执行上述8种操作时，还必须满足如下规则：

①不允许read和load、store和write操作单独出现，即不允许一个变量从主内存中读取了但工作内存没有接受，或者从工作内存发起回写但主内存不接受的情况出现。

②不允许一个线程丢弃它的最近的assign操作，即变量在工作内存中发生赋值操作，必须将变量的变化同步回主内存中。

③不允许一个线程无原因（未发生assign操作）的将一个变量从工作内存同步回主内存。

④一个新的变量只能在主内存中“诞生”，不允许工作内存使用一个未初始化（load或assign操作）的变量，换句话说，就是对一个变量实施use、store操作之前，必须先执行assign和load操作。

⑤一个变量在同一个时刻只允许一个线程对其进行lock操作，但lock操作可以被同一条线程重复执行多次，多次执行lock后，只有执行相同次数的unlock操作，变量才可以被解锁。

⑥如果对一个变量执行lock操作，那将会清空工作内存此变量的值，在执行引擎使用到这个变量前，需要重新执行load或assign操作初始化变量的值。

⑦如果一个变量事先没有被lock操作锁定，那就不允许对它执行unlock操作，也不允许unlock一个被其他线程锁定的变量。

⑧对一个变量进行unlock操作之前，必须将此变量同步回主内存中（执行store和write操作）。

有了JMM中的这些交互协议与规则，再去思考线程安全问题时，可能java程序中哪些内存访问操作是线程安全的，就已经清晰了。但是这种定义严谨又十分繁琐，虚拟机中定义了一种等效判定原则---happens-before原则，上篇博文提及过。

其实这种内存交互的协议的设计，可以抽象应用到很多层面，比如我要确保分布式缓存的一致性，主从DB的一致性，包括分布式事务的实现，都可以参照这种设计模式。

Java虚拟机高效并发之Java内存模型

猜你喜欢