Volatile

在多线程并发编程中 synchronizedvolatile 都扮演着重要的角色,volatile 是轻量级的 synchronized,它在多处理器开发中保证了共享变量的“可见性”。

内存可见性

  • 内存可见性,指的是线程之间的可见性,当一个线程修改了共享变量时,另一个线程可以读取到这个修改后的值。

  • 所谓内存可见性,指的是当一个线程对volatile修饰的变量进行写操作(比如step 2)时,会立即把该线程对应的本地内存中的共享变量的值刷新到主内存;当一个线程对volatile修饰的变量进行读操作(比如step 3)时,会立即把该线程对应的本地内存置为无效,从主内存中读取共享变量的值。

    public class VolatileDemo {
        int a = 0;
        volatile boolean flag = false;

        public void writer() {
            a = 1; // step 1
            flag = true; // step 2
        }

        public void reader() {
            if (flag) { // step 3
                System.out.println(a); // step 4
            }
        }
    }

    public static void main(String[] args) throws InterruptedException {
        VolatileDemo volatileDemo = new VolatileDemo();
        Thread a = new Thread(new Runnable() {
            @Override
            public void run() {
                volatileDemo.writer();
            }
        });

        Thread b = new Thread(new Runnable() {
            @Override
            public void run() {
                volatileDemo.reader();
            }
        });

        a.start();
        b.start();
    }

这个时候的输出结果为:1

而如果flag变量没有用volatile修饰,在step 2,线程A的本地内存里面的变量就不会立即更新到主内存,那随后线程B也同样不会去主内存拿最新的值,仍然使用线程B本地内存缓存的变量的值a = 0,flag = false。

总线嗅探技术

那其他CPU是怎么知道要将缓存更新为失效的呢?这里是用到了总线嗅探技术。

每个CPU不断嗅探总线上传播的数据来检查自己缓存值是否过期了,如果处理器发现自己的缓存行对应的内存地址被修改,就会将当前处理器的缓存行设置为无效状态,当处理器对这个数据进行修改操作的时候,会重新从内存中把数据读取到处理器缓存中。

禁止重排序

为优化程序性能,对原有的指令执行顺序进行优化重新排序。重排序可能发生在多个阶段,比如编译重排序、CPU重排序等。

在JSR-133之前的旧的Java内存模型中,是允许volatile变量与普通变量重排序的。那上面的案例中,可能就会被重排序成下列时序来执行:

  • 线程A写volatile变量,step 2,设置flag为true;

  • 线程B读同一个volatile,step 3,读取到flag为true;

  • 线程B读普通变量,step 4,读取到 a = 0;

  • 线程A修改普通变量,step 1,设置 a = 1;

可见,如果volatile变量与普通变量发生了重排序,虽然volatile变量能保证内存可见性,也可能导致普通变量读取错误。

所以在旧的内存模型中,volatile的写-读就不能与锁的释放-获取具有相同的内存语义了。为了提供一种比锁更轻量级的线程间的通信机制,JSR-133专家组决定增强volatile的内存语义:严格限制编译器和处理器对volatile变量与普通变量的重排序。

volatile的非原子性

  • volatile虽然增加了实例变量在多个线程之间的可见性,但是却不具备通同步性,也就是不具备原子性。

  • 使用volatile关键字之后,可以强制从公共内存中读取变量的值。

  • Volatile只能保证对单个volatile变量的读/写具有原子性。

内存屏障

在volatile生成的指令序列前后插入内存屏障(Memory Barries)来禁止处理器重排序。

什么是内存屏障?硬件层面,内存屏障分两种:读屏障(Load Barrier)和写屏障(Store Barrier)。内存屏障有两个作用:

  1. 阻止屏障两侧的指令重排序;

  2. 强制把写缓冲区/高速缓存中的脏数据等写回主内存,或者让缓存中相应的数据失效

编译器在生成字节码时,会在指令序列中插入内存屏障来禁止特定类型的处理器重排序。编译器选择了一个比较保守的JMM内存屏障插入策略,这样可以保证在任何处理器平台,任何程序中都能得到正确的volatile内存语义。这个策略是:

  • 在每个volatile写操作前插入一个StoreStore屏障

  • 在每个volatile写操作后插入一个StoreLoad屏障

  • 在每个volatile读操作后插入一个LoadLoad屏障

  • 在每个volatile读操作后再插入一个LoadStore屏障

再逐个解释一下这几个屏障。注:下述Load代表读操作,Store代表写操作

LoadLoad屏障:对于这样的语句Load1; LoadLoad; Load2,在Load2及后续读取操作要读取的数据被访问前,保证Load1要读取的数据被读取完毕。 StoreStore屏障:对于这样的语句Store1; StoreStore; Store2,在Store2及后续写入操作执行前,这个屏障会把Store1强制刷新到内存,保证Store1的写入操作对其它处理器可见。 LoadStore屏障:对于这样的语句Load1; LoadStore; Store2,在Store2及后续写入操作被刷出前,保证Load1要读取的数据被读取完毕。 StoreLoad屏障:对于这样的语句Store1; StoreLoad; Load2,在Load2及后续所有读取操作执行前,保证Store1的写入对所有处理器可见。它的开销是四种屏障中最大的(冲刷写缓冲器,清空无效化队列)。在大多数处理器的实现中,这个屏障是个万能屏障,兼具其它三种内存屏障的功能

volatile的用途

volatile的主要使用场合是在多个线程中可以感知到实例变量被更改了,也就是多线程读取共享变量时可以获得最新的值来使用。

在保证内存可见性这一点上,volatile有着与锁相同的内存语义,所以可以作为一个“轻量级”的锁来使用。但由于volatile仅仅保证对单个volatile变量的读/写具有原子性,而锁可以保证整个临界区代码的执行具有原子性。所以在功能上,锁比volatile更强大;在性能上,volatile更有优势。

比如我们熟悉的单例模式,其中有一种实现方式是“双重锁检查”,比如这样的代码:

public class Singleton {

    private static volatile Singleton instance; // 不使用volatile关键字

    // 双重锁检验
    public static Singleton getInstance() {
        if (instance == null) { // 第7行
            synchronized (Singleton.class) {
                if (instance == null) {
                    instance = new Singleton(); // 第10行
                }
            }
        }
        return instance;
    }
}

synchronized和volatile对比

  • volatile是线程同步的轻量级的实现,所以volatile性能比synchronized要好,并且volatile只能修饰变量,而synchronized可以修饰方法以及代码块。

  • 多线程访问volatile不会发生阻塞,而synchronized会发生阻塞。

  • volatile能保证数据的可见性,但不能保证原子性。而synchronized可以保证原子性,也可以间接保证可见性,因为synchronized会将私有内存和公共内存中的数据做同步,所以更加推荐使用synchronized。

  • volatile的关注点在于解决变量在多个线程之间的可见性,而synchronized的关注点在于解决多个线程之间访问资源的同步性。

最后更新于