你应该知道的 volatile 关键字
前言
不管是在面试还是实际开发中 volatile 都是一个应该掌握的技能。
首先来看看为什么会出现这个关键字。
内存可见性
由于 Java 内存模型( JMM)规定,所有的变量都存放在主内存中,而每个线程都有着自己的工作内存(高速缓存)。
线程在工作时,需要将主内存中的数据拷贝到工作内存中。这样对数据的任何操作都是基于工作内存(效率提高),并且不能直接操作主内存以及其他线程工作内存中的数据,之后再将更新之后的数据刷新到主内存中。
这里所提到的主内存可以简单认为是堆内存,而工作内存则可以认为是栈内存。
如下图所示:

所以在并发运行时可能会出现线程 B 所读取到的数据是线程 A 更新之前的数据。
显然这肯定是会出问题的,因此 volatile 的作用出现了:
当一个变量被
volatile修饰时,任何线程对它的写操作都会立即刷新到主内存中,并且会强制让缓存了该变量的线程中的数据清空,必须从主内存重新读取最新数据。
volatile 修饰之后并不是让线程直接从主内存中获取数据,依然需要将变量拷贝到工作内存中。
内存可见性的应用
当我们需要在两个线程间依据主内存通信时,通信的那个变量就必须的用 volatile 来修饰:
public class Volatile implements Runnable{private static volatile boolean flag = true ;@Overridepublic void run() {while (flag){System.out.println(Thread.currentThread().getName() + "正在运行。。。");}System.out.println(Thread.currentThread().getName() +"执行完毕");}public static void main(String[] args) throws InterruptedException {Volatile aVolatile = new Volatile();new Thread(aVolatile,"thread A").start();System.out.println("main 线程正在运行") ;TimeUnit.MILLISECONDS.sleep(100) ;aVolatile.stopThread();}private void stopThread(){flag = false ;}}
主线程在修改了标志位使得线程 A 立即停止,如果没有用 volatile 修饰,就有可能出现延迟。
但这里有个误区,这样的使用方式容易给人的感觉是:
对
volatile修饰的变量进行并发操作是线程安全的。
这里要重点强调, volatile 并不能保证线程安全性!
如下程序:
public class VolatileInc implements Runnable{private static volatile int count = 0 ; //使用 volatile 修饰基本数据内存不能保证原子性//private static AtomicInteger count = new AtomicInteger() ;@Overridepublic void run() {for (int i=0;i<10000 ;i++){count ++ ;//count.incrementAndGet() ;}}public static void main(String[] args) throws InterruptedException {VolatileInc volatileInc = new VolatileInc() ;Thread t1 = new Thread(volatileInc,"t1") ;Thread t2 = new Thread(volatileInc,"t2") ;t1.start();//t1.join();t2.start();//t2.join();for (int i=0;i<10000 ;i++){count ++ ;//count.incrementAndGet();}System.out.println("最终Count="+count);}}
当我们三个线程(t1,t2,main)同时对一个 int 进行累加时会发现最终的值都会小于 30000。
这是因为虽然
volatile保证了内存可见性,每个线程拿到的值都是最新值,但count++这个操作并不是原子的,这里面涉及到获取值、自增、赋值的操作并不能同时完成。
- 所以想到达到线程安全可以使这三个线程串行执行(其实就是单线程,没有发挥多线程的优势)。
- 也可以使用
synchronize或者是锁的方式来保证原子性。 - 还可以用
Atomic包中AtomicInteger来替换int,它利用了CAS算法来保证了原子性。
指令重排
内存可见性只是 volatile 的其中一个语义,它还可以防止 JVM 进行指令重排优化。
举一个伪代码:
int a=10 ;//1int b=20 ;//2int c= a+b ;//3
一段特别简单的代码,理想情况下它的执行顺序是: 1>2>3。但有可能经过 JVM 优化之后的执行顺序变为了 2>1>3。
可以发现不管 JVM 怎么优化,前提都是保证单线程中最终结果不变的情况下进行的。
可能这里还看不出有什么问题,那看下一段伪代码:
private static Map<String,String> value ;private static volatile boolean flag = fasle ;//以下方法发生在线程 A 中 初始化 Mappublic void initMap(){//耗时操作value = getMapValue() ;//1flag = true ;//2}//发生在线程 B中 等到 Map 初始化成功进行其他操作public void doSomeThing(){while(!flag){sleep() ;}//dosomethingdoSomeThing(value);}
这里就能看出问题了,当 flag 没有被 volatile 修饰时, JVM 对 1 和 2 进行重排,导致 value 都还没有被初始化就有可能被线程 B 使用了。
所以加上 volatile 之后可以防止这样的重排优化,保证业务的正确性。
指令重排的的应用
一个经典的使用场景就是双重懒加载的单例模式了:
public class Singleton {private static volatile Singleton singleton;private Singleton() {}public static Singleton getInstance() {if (singleton == null) {synchronized (Singleton.class) {if (singleton == null) {//防止指令重排singleton = new Singleton();}}}return singleton;}}
这里的 volatile 关键字主要是为了防止指令重排。
如果不用 , singleton=newSingleton();,这段代码其实是分为三步:
- 分配内存空间。(1)
- 初始化对象。(2)
- 将
singleton对象指向分配的内存地址。(3)
加上 volatile 是为了让以上的三步操作顺序执行,反之有可能第二步在第三步之前被执行就有可能某个线程拿到的单例对象是还没有初始化的,以致于报错。
总结
volatile 在 Java 并发中用的很多,比如像 Atomic 包中的 value、以及 AbstractQueuedLongSynchronizer中的 state 都是被定义为 volatile 来用于保证内存可见性。
将这块理解透彻对我们编写并发程序时可以提供很大帮助。
号外
最近在总结一些 Java 相关的知识点,感兴趣的朋友可以一起维护。
原创文章,转载请注明: 转载自并发编程网 – ifeve.com本文链接地址: 你应该知道的 volatile 关键字




你好
我在运行 AtomicInteger 自增的时候
也没有每次都保证30000的输出
请问这是什么原因呢
因为在最终打印的时候有可能上面的两个线程还没有执行完毕。你可以在最终打印之前调用 t1 和 t2 的 join方法再试下就没问题了。
hello, 有个疑问想请教一下。
双重校验锁实现单例的代码,我看到《Java并发编程的艺术》这本书,以及你这篇文章的解释,都是volatile防止了指令的重排序。
但我想,是不是从happens-before的角度来理解也是可以的呢?
happens-before关于volatile变量规则:对一个volatile域的写,happens-before于任意后续对这个volatile域的读。那么singleton=newSingleton();这一语句的内部指令无论如何重排,对于后续的读操作,实际上是不受影响的,因为有内存屏障的存在,肯定会读到最后写入的值。那么其实内部那三步指令如何重排,根本不重要。
我的疑惑是,这两种解释哪一种更准确?还是说两种角度都OK?
期望你的答复,thanks!!
你的理解是对的,volatile在dlc问题上面的运用,说白了就是保证其他线程拿到这个单例的时候(singleton!=null),但是内容还不完整(构造还没有执行完)的情况。
“这里所提到的主内存可以简单认为是堆内存,而工作内存则可以认为是栈内存。” 结合 “线程在工作时,需要将主内存中的数据拷贝到工作内存中。”
那岂不是每每需要把数据从堆拷贝到栈?请问我的脑补对吗?
可见性问题明明就是cache和memory的一致性问题,你这个“认为”也太离谱了吧!