Skip to content

Java 内存模型详解

一、内存模型基本概念

1. 什么是内存模型

内存模型(Memory Model)是计算机系统中定义程序行为的一组规则,它规定了程序中变量(包括实例字段、静态字段和构成数组对象的元素)如何访问内存,以及在多线程环境下如何保证内存操作的正确性。

Java内存模型(Java Memory Model, JMM)是Java语言规范的一部分,它定义了:

  • 多线程之间如何通过内存进行交互
  • 对内存读写操作的可见性、原子性和有序性规则
  • 线程之间的先行发生(happens-before)关系

2. 硬件内存架构与JMM的关系

现代计算机系统通常采用多级缓存架构,这导致了缓存一致性问题。JMM的设计目的就是屏蔽各种硬件和操作系统的内存访问差异,为Java程序提供一致的内存可见性保证。

硬件内存架构:

  • 主内存(Main Memory):所有CPU共享的内存
  • CPU缓存(L1, L2, L3 Cache):各CPU核心的高速缓存
  • 寄存器(Registers):CPU内部的高速存储单元

缓存一致性问题:

  • 多核CPU环境下,每个核心有自己的缓存
  • 同一变量在不同缓存中的值可能不一致
  • 写操作需要通过缓存一致性协议同步到其他核心

JMM抽象:

  • 主内存:对应物理内存
  • 工作内存:对应CPU缓存和寄存器
  • 定义了变量从主内存复制到工作内存,以及从工作内存写回主内存的规则

二、内存可见性问题

1. 可见性的定义

可见性是指当一个线程修改了共享变量的值,其他线程能够立即看到这个修改。在多线程环境下,由于CPU缓存的存在,可见性问题可能导致线程看到过期的数据。

2. 可见性问题的根源

缓存导致的可见性问题:

  • 线程A修改共享变量后,更新只在自己的CPU缓存中,未同步到主内存
  • 线程B从主内存读取变量,得到的是过期值

重排序导致的可见性问题:

  • 编译器优化可能改变代码执行顺序
  • CPU指令重排序可能导致实际执行顺序与代码顺序不一致
  • 内存系统重排序可能导致读操作感知到的写操作顺序与实际执行顺序不同

3. 可见性问题的示例

java
public class VisibilityDemo {
    private boolean flag = false;
    
    public void writer() {
        flag = true; // 线程A执行
    }
    
    public void reader() {
        if (flag) { // 线程B可能看不到线程A的修改
            System.out.println("Flag is true");
        }
    }
}

三、Happens-Before规则

1. Happens-Before关系概述

Happens-Before是JMM中定义的两个操作之间的偏序关系。如果操作A happens-before操作B,那么操作A的结果对操作B可见,且操作A的执行顺序排在操作B之前。

Happens-Before规则是理解Java内存模型的关键,它为开发人员提供了判断多线程程序是否正确的依据。

2. 八大Happens-Before规则

程序顺序规则(Program Order Rule):

  • 在一个线程内,按照程序代码顺序,书写在前面的操作happens-before书写在后面的操作
  • 注意:这并不意味着实际执行顺序与代码顺序完全一致,因为可能存在重排序

监视器锁规则(Monitor Lock Rule):

  • 解锁操作happens-before后续对同一把锁的加锁操作
  • 这确保了线程释放锁时的内存状态对获取该锁的线程可见

volatile变量规则(Volatile Variable Rule):

  • 对一个volatile变量的写操作happens-before后续对这个变量的读操作
  • volatile关键字保证了变量的可见性和一定程度的有序性

线程启动规则(Thread Start Rule):

  • Thread对象的start()方法happens-before线程中的任何操作
  • 启动线程前的准备工作对启动后的线程可见

线程终止规则(Thread Termination Rule):

  • 线程中的所有操作都happens-before其他线程检测到该线程已终止
  • 可以通过Thread.join()或Thread.isAlive()等方法检测线程是否终止

线程中断规则(Thread Interruption Rule):

  • 对线程interrupt()方法的调用happens-before被中断线程检测到中断事件
  • 可以通过Thread.interrupted()或Thread.isInterrupted()检测中断

对象终结规则(Finalizer Rule):

  • 一个对象的初始化完成(构造函数执行结束)happens-before它的finalize()方法的开始
  • 确保对象在被回收前已经完全初始化

传递性规则(Transitivity):

  • 如果操作A happens-before操作B,操作B happens-before操作C,那么操作A happens-before操作C
  • 通过传递性可以推导出更多的happens-before关系

3. Happens-Before规则的应用

利用Happens-Before规则可以判断多线程程序的正确性,特别是在判断可见性和有序性方面。

java
public class HappensBeforeExample {
    private int a = 0;
    private boolean flag = false;
    
    // 线程A执行
    public void writer() {
        a = 1; // 操作1
        flag = true; // 操作2
        // 操作1 happens-before 操作2(程序顺序规则)
    }
    
    // 线程B执行
    public void reader() {
        if (flag) { // 操作3
            // 操作2 happens-before 操作3(volatile规则)
            // 根据传递性,操作1 happens-before 操作4
            System.out.println("a = " + a); // 操作4,一定能看到a=1
        }
    }
}

四、Volatile关键字详解

1. Volatile的内存语义

Volatile是Java提供的轻量级同步机制,它具有以下特性:

  • 可见性:对一个volatile变量的修改对其他线程可见
  • 有序性:禁止指令重排序优化
  • 不保证原子性:volatile不能保证复合操作的原子性

2. Volatile的实现原理

Volatile变量的读写操作会通过内存屏障(Memory Barriers)来保证可见性和有序性:

写操作实现:

  1. 将当前CPU缓存行的数据写回到主内存
  2. 这个写回操作会使其他CPU中缓存了该内存地址的数据失效

读操作实现:

  1. 将缓存行置为无效
  2. 从主内存重新读取数据到CPU缓存

内存屏障:

  • 写屏障(Store Barrier):确保之前的所有写操作都已完成并刷新到主内存
  • 读屏障(Load Barrier):确保后续的读操作都读取主内存中的最新值
  • 全屏障(Full Barrier):同时具有写屏障和读屏障的功能

3. Volatile的适用场景

Volatile适用于以下场景:

状态标志:

java
private volatile boolean shutdownRequested;

public void shutdown() {
    shutdownRequested = true;
}

public void doWork() {
    while (!shutdownRequested) {
        // 执行工作
    }
}

双重检查锁定(Double-Checked Locking):

java
public class Singleton {
    private static volatile Singleton instance;
    
    private Singleton() {}
    
    public static Singleton getInstance() {
        if (instance == null) { // 第一次检查
            synchronized (Singleton.class) {
                if (instance == null) { // 第二次检查
                    instance = new Singleton(); // volatile防止重排序
                }
            }
        }
        return instance;
    }
}

独立观察:

  • 多个线程之间用volatile变量来标记一些生命周期事件(初始化、加载完成等)

4. Volatile的局限性

Volatile不适合用于以下场景:

复合操作:

java
private volatile int count = 0;

// 错误:不保证原子性
public void increment() {
    count++; // 读取-修改-写入三步操作,非原子
}

对于复合操作,应使用synchronized或Atomic类:

java
private AtomicInteger count = new AtomicInteger(0);

public void increment() {
    count.incrementAndGet(); // 原子操作
}

五、原子性、可见性与有序性

1. 原子性

原子性指一个操作是不可中断的,要么全部执行成功,要么全部执行失败,不会出现部分执行的情况。

Java中的原子操作:

  • 基本数据类型(long和double除外)的读取和赋值操作
  • 引用类型的读取和赋值操作
  • 使用Atomic类实现的原子操作
  • 使用synchronized或Lock保证的代码块操作

非原子操作:

  • 复合操作,如i++(读取-修改-写入)
  • 64位数据类型(long和double)的非volatile读取和赋值(可能分两次32位操作)

2. 可见性

可见性指当一个线程修改了共享变量的值,其他线程能够立即看到这个修改。

保证可见性的方法:

  • volatile关键字
  • synchronized关键字(解锁前会将工作内存同步到主内存)
  • final关键字(初始化完成后对其他线程可见)
  • Lock接口的实现(如ReentrantLock)

3. 有序性

有序性指程序执行的顺序按照代码的先后顺序执行。在多线程环境下,由于重排序,可能会导致执行顺序与代码顺序不一致。

导致有序性问题的原因:

  • 编译器优化重排序
  • CPU指令级重排序
  • 内存系统重排序

保证有序性的方法:

  • volatile关键字(禁止重排序)
  • synchronized关键字(保证同一时刻只有一个线程执行代码块)
  • Lock接口的实现
  • Happens-Before规则

六、JMM中的重排序

1. 重排序的类型

编译器重排序:

  • 编译器在不改变单线程程序语义的前提下,可以重新安排语句的执行顺序
  • 例如:将无关的赋值操作重排序以提高性能

指令级并行重排序:

  • 现代处理器采用指令级并行技术,允许多个指令重叠执行
  • 如果不存在数据依赖性,处理器可以改变语句对应机器指令的执行顺序

内存系统重排序:

  • 由于CPU缓存的存在,可能导致读取操作感知到的写操作顺序与实际执行顺序不同
  • 写缓冲区的引入会导致写操作看起来是无序的

2. 数据依赖性

如果两个操作访问同一个变量,且其中一个操作为写操作,则这两个操作之间存在数据依赖性。数据依赖分为三种类型:

写后读(Read After Write, RAW):

java
int a = 1; // 写a
int b = a; // 读a

写后写(Write After Write, WAW):

java
int a = 1; // 写a
int a = 2; // 再次写a

读后写(Write After Read, WAR):

java
int a = b; // 读b
int b = 1; // 写b

编译器和处理器不会对存在数据依赖关系的操作进行重排序,因为这会改变程序的执行结果。

3. as-if-serial语义

as-if-serial语义指不管怎么重排序,程序的执行结果都不能被改变。编译器、运行时和处理器都必须遵守这一语义。

as-if-serial语义保证了单线程程序的正确性,但在多线程环境下可能导致问题,因为重排序可能会破坏线程间的语义。

七、内存屏障

1. 内存屏障的类型

内存屏障是一组处理器指令,用于控制特定条件下的内存操作顺序,防止重排序。

Load Barrier(读屏障):

  • 确保屏障之后的读操作不会被重排序到屏障之前
  • 使处理器缓存失效,强制从主内存读取最新数据

Store Barrier(写屏障):

  • 确保屏障之前的写操作不会被重排序到屏障之后
  • 将处理器缓存中的数据刷新到主内存

Full Barrier(全屏障):

  • 同时具有读屏障和写屏障的功能
  • 确保屏障之前的读写操作不会被重排序到屏障之后,屏障之后的读写操作也不会被重排序到屏障之前

2. JVM中的内存屏障

JVM通过内存屏障来实现volatile的内存语义和Happens-Before规则。不同的处理器架构有不同的内存屏障实现。

在HotSpot JVM中:

  • 对于volatile变量的写操作,会在操作前后插入内存屏障
  • 对于volatile变量的读操作,会在操作前后插入内存屏障
  • 对于synchronized块的进入和退出,也会插入相应的内存屏障

3. 内存屏障的性能影响

内存屏障会导致以下性能影响:

  • 禁止重排序,限制了编译器和处理器的优化
  • 强制刷新缓存,增加了内存访问的延迟
  • 可能导致CPU流水线停顿

在使用同步机制时,应权衡正确性和性能,避免过度使用内存屏障。

八、实践建议

1. 正确使用Volatile

适合使用Volatile的场景:

  • 状态标志(如停止信号、初始化完成标志)
  • 双重检查锁定中的单例对象引用
  • 独立观察的场景

不适合使用Volatile的场景:

  • 需要原子性的复合操作
  • 依赖锁的互斥性来保证线程安全的场景

2. 选择合适的同步机制

同步机制的选择:

  • 简单的原子操作:Atomic类
  • 需要互斥的代码块:synchronized或ReentrantLock
  • 只需要可见性:volatile
  • 读写比例失调:ReadWriteLock
  • 计数信号:CountDownLatch, CyclicBarrier

3. 避免常见的并发错误

常见并发错误:

  • 忽视内存可见性问题
  • 错误地认为volatile可以保证原子性
  • 线程安全的对象组合在一起不一定是线程安全的
  • 过度同步导致性能问题
  • 锁粒度过大或过小

4. 性能优化建议

内存模型相关的性能优化:

  • 减少共享变量的范围和可见性
  • 合理使用局部变量(线程私有,无同步开销)
  • 避免不必要的volatile使用
  • 使用ThreadLocal存储线程特有数据
  • 选择合适的锁粒度和锁策略
  • 利用无锁数据结构和算法

九、JVM内存模型与实践案例

1. 单例模式的正确实现

双重检查锁定(DCL):

java
public class Singleton {
    // 必须使用volatile防止重排序
    private static volatile Singleton instance;
    
    private Singleton() {
        // 防止通过反射创建多个实例
        if (instance != null) {
            throw new RuntimeException("Singleton instance already exists");
        }
    }
    
    public static Singleton getInstance() {
        if (instance == null) { // 第一次检查
            synchronized (Singleton.class) {
                if (instance == null) { // 第二次检查
                    // instance = new Singleton()分为三步:
                    // 1. 分配内存空间
                    // 2. 初始化对象
                    // 3. 将引用指向内存空间
                    // volatile防止2和3重排序
                    instance = new Singleton();
                }
            }
        }
        return instance;
    }
}

静态内部类方式:

java
public class Singleton {
    private Singleton() {}
    
    // 静态内部类,利用JVM类加载机制保证线程安全
    private static class SingletonHolder {
        private static final Singleton INSTANCE = new Singleton();
    }
    
    public static Singleton getInstance() {
        return SingletonHolder.INSTANCE;
    }
}

2. 线程安全的计数器实现

使用Atomic类:

java
public class ConcurrentCounter {
    private final AtomicInteger count = new AtomicInteger(0);
    
    public void increment() {
        count.incrementAndGet();
    }
    
    public void decrement() {
        count.decrementAndGet();
    }
    
    public int getCount() {
        return count.get();
    }
}

使用LongAdder(高并发场景更高效):

java
public class ConcurrentCounter {
    private final LongAdder count = new LongAdder();
    
    public void increment() {
        count.increment();
    }
    
    public void decrement() {
        count.decrement();
    }
    
    public long getCount() {
        return count.sum();
    }
}

3. 线程安全的缓存实现

java
public class ConcurrentCache<K, V> {
    // 使用ConcurrentHashMap保证线程安全
    private final ConcurrentHashMap<K, V> cache = new ConcurrentHashMap<>();
    private final LoadingCache<K, V> loadingCache;
    
    public ConcurrentCache(CacheLoader<K, V> loader) {
        // 使用Guava的LoadingCache实现自动加载
        this.loadingCache = CacheBuilder.newBuilder()
            .maximumSize(1000)
            .expireAfterWrite(10, TimeUnit.MINUTES)
            .build(loader);
    }
    
    public V get(K key) throws ExecutionException {
        return loadingCache.get(key);
    }
    
    public void put(K key, V value) {
        loadingCache.put(key, value);
    }
    
    public void invalidate(K key) {
        loadingCache.invalidate(key);
    }
}

十、总结与展望

1. JMM的核心价值

Java内存模型通过一系列规则和机制,解决了多线程环境下的内存可见性、原子性和有序性问题,为Java程序员提供了可靠的内存语义保证。

2. 未来发展趋势

随着硬件架构的发展和编程语言的演进,内存模型也在不断优化:

  • 更细粒度的内存操作控制
  • 更低开销的同步机制
  • 更好的硬件亲和性
  • 更丰富的并发原语

3. 最佳实践建议

  • 深入理解JMM的基本概念和规则
  • 正确使用synchronized、volatile等同步机制
  • 优先使用Java并发包中的高级工具类
  • 编写简洁、清晰的并发代码
  • 进行充分的并发测试和性能评估

通过合理利用Java内存模型,开发者可以编写出高效、正确的多线程程序,充分发挥多核处理器的性能优势。

基于 MIT 许可发布