深入理解JVM:Java内存模型与线程

来自Wikioe
跳到导航 跳到搜索


概述

衡量一个服务性能的高低好坏,每秒事务处理数(Transactions Per Second,TPS)是重要的指标之一,它代表着一秒内服务端平均能响应的请求总数,而TPS值与程序的并发能力又有非常密切的关系。

硬件的效率与一致性

  1. 硬件的效率问题:
    处理器至少要与内存交互,如读取运算数据、存储运算结果等,这个I/O操作就是很难消除的(无法仅靠寄存器来完成所有运算任务)。
  2. 解决:
    高速缓存(Cache),用来作为内存与处理器之间的缓冲;
  3. 导致新的问题:
    缓存一致性(Cache Coherence):每个处理器都有自己的高速缓存,而它们又共享同一主内存(Main Memory),多个处理器任务涉及同一主内存区域时,可能导致各自的缓存数据不一致。
  4. 解决:
    各个处理器访问缓存时都遵循一些协议:MSI、MESI(Illinois Protocol)、MOSI、Synapse、Firefly 及 Dragon Protocol等。


处理器、高速缓存、主内存间的交互关系.jpg


  • “内存模型”:可以理解为在特定的操作协议下,对特定的内存或高速缓存进行读写访问的过程抽象。
    不同架构的物理机器可以拥有不一样的内存模型,而Java虚拟机也有自己的内存模型;


硬件的内存模型:

   除了增加高速缓存之外,为了使处理器内部的运算单元能尽量被充分利用,处理器可能会对输入代码进行乱序执行(Out-Of-Order Execution)优化,处理器会在计算之后将乱序执行的结果重组,保证该结果与顺序执行的结果是一致的,但并不保证程序中各个语句计算的先后顺序与输入代码中的顺序一致,因此如果存在一个计算任务依赖另外一个计算任务的中间结果,那么其顺序性并不能靠代码的先后顺序来保证。

与处理器的乱序执行优化类似,Java虚拟机的即时编译器中也有指令重排序(Instruction Reorder)优化。

Java内存模型(Java Memory Model,JMM)

《Java虚拟机规范》中曾试图定义一种“Java内存模型”[2](Java Memory Model,JMM)来屏蔽各种硬件和操作系统的内存访问差异,以实现让Java程序在各种平台下都能达到一致的内存访问效果。

主内存与工作内存

  1. 主内存(Main Memory):Java内存模型规定了所有的变量都存储在主内存中(仅是虚拟机内存的一部分);
  2. 工作内存(Working Memory):线程的工作内存中保存了被该线程使用的变量的主内存副本;
    • 每条线程还有自己的工作内存。
    • 线程对变量的所有操作(读取、赋值等)都必须在工作内存中进行,而不能直接读写主内存中的数据。
    • 不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。


线程、主内存、工作内存三者的交互关系:【与前一节物理机内存模型类比】

线程、主内存、工作内存三者的交互关系.jpg

内存间交互操作

Java内存模型中定义了以下8种操作来完成:

  • Java虚拟机实现时必须保证下面提及的每一种操作都是原子的、不可再分的。
    (对于double和long类型的变量来说,load、store、read和write操作在某些平台上允许有例外)
  1. lock(锁定):作用于主内存的变量,它把一个变量标识为一条线程独占的状态。
  2. unlock(解锁):作用于主内存的变量,它把一个处于锁定状态的变量释放出来,释放后的变量才可以被其他线程锁定。
  3. read(读取):作用于主内存的变量,它把一个变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用。
  4. load(载入):作用于工作内存的变量,它把read操作从主内存中得到的变量值放入工作内存的变量副本中。
  5. use(使用):作用于工作内存的变量,它把工作内存中一个变量的值传递给执行引擎,每当虚拟机遇到一个需要使用变量的值的字节码指令时将会执行这个操作。
  6. assign(赋值):作用于工作内存的变量,它把一个从执行引擎接收的值赋给工作内存的变量,每当虚拟机遇到一个给变量赋值的字节码指令时执行这个操作。
  7. store(存储):作用于工作内存的变量,它把工作内存中一个变量的值传送到主内存中,以便随后的write操作使用。
  8. write(写入):作用于主内存的变量,它把store操作从工作内存中得到的变量的值放入主内存的变量中。
  • 如果要把一个变量从主内存拷贝到工作内存,那就要按顺序执行read和load操作;如果要把变量从工作内存同步回主内存,就要按顺序执行store和write操作。(必须按顺序执行,但不要求是连续执行)

除此之外,Java内存模型还规定了在执行上述8种基本操作时必须满足如下规则:

  1. 不允许read和load、store和write操作之一单独出现,即不允许一个变量从主内存读取了但工作内存不接受,或者工作内存发起回写了但主内存不接受的情况出现。
  2. 不允许一个线程丢弃它最近的assign操作,即变量在工作内存中改变了之后必须把该变化同步回主内存。
  3. 不允许一个线程无原因地(没有发生过任何assign操作)把数据从线程的工作内存同步回主内存中。
  4. 一个新的变量只能在主内存中“诞生”,不允许在工作内存中直接使用一个未被初始化(load或assign)的变量,换句话说就是对一个变量实施use、store操作之前,必须先执行assign和load操作。
  5. 一个变量在同一个时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次执行lock后,只有执行相同次数的unlock操作,变量才会被解锁。
  6. 如果对一个变量执行lock操作,那将会清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作以初始化变量的值。
  7. 如果一个变量事先没有被lock操作锁定,那就不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定的变量。
  8. 对一个变量执行unlock操作之前,必须先把此变量同步回主内存中(执行store、write操作)。


  • 这8种内存访问操作以及上述规则限定,再加上稍后会介绍的专门针对volatile的一些特殊规定,就已经能准确地描述出Java程序中哪些内存访问操作在并发下才是安全的。
    (以上操作可以简化为read、write、lock和unlock四种)另一种等效判断原则——“先行发生原则”,亦可用来确定一个操作在并发环境下是否安全的。

对于volatile型变量的特殊规则

针对long和double型变量的特殊规则

原子性、可见性与有序性

先行发生原则

Java与线程

线程的实现

Java线程调度

状态转换

Java与协程

12.5.1 内核线程的局限 12.5.2 协程的复苏 12.5.3 Java的解决方案