返回介绍

2. volatile 关键字的理解

发布于 2024-09-08 13:17:47 字数 5647 浏览 0 评论 0 收藏 0

具有了以下两点特性:

  • 1 . 保证了不同线程对该变量操作的内存可见性;
  • 2 . 禁止指令重排序

内存可见性和是重排序

java 内存模型(JMM)

  • Java 虚拟机规范试图定义一种 Java 内存模型(JMM),来屏蔽掉各种硬件和操作系统的内存访问差异,让 Java 程序在各种平台上都能达到一致的内存访问效果。
  • 简单来说,由于 CPU 执行指令的速度是很快的,但是内存访问的速度就慢了很多,相差的不是一个数量级,所以搞处理器的那群大佬们又在 CPU 里加了好几层高速缓存。
  • 在 Java 内存模型里,对上述的优化又进行了一波抽象。JMM 规定所有变量都是存在主存中的,类似于上面提到的普通内存,每个线程又包含自己的工 作内存,方便理解就可以看成 CPU 上的寄存器或者高速缓存。所以线程的操作都是以工作内存为主,它们只能访问自己的工作内存,且工作前后都要把值在同步回 主内存。

这么说得我自己都有些不清楚了,拿张纸画一下:
输入图片说明

在线程执行时,首先会从主存中 read 变量值,再 load 到工作内存中的副本中,然后再传给处理器执行,执行完毕后再给工作内存中的副本赋值,随后工作内存再把值传回给主存,主存中的值才更新。

使用工作内存和主存,虽然加快的速度,但是也带来了一些问题。比如看下面一个例子:

i = i + 1;

假设 i 初值为 0,当只有一个线程执行它时,结果肯定得到 1,当两个线程执行时,会得到结果 2 吗?这倒不一定了。可能存在这种情况:

输入图片说明

  • 如果两个线程按照上面的执行流程,那么 i 最后的值居然是 1 了。如果最后的写回生效的慢,你再读取 i 的值,都可能是 0,这就是缓存不一致问题。
  • 下面就要提到你刚才问到的问题了,JMM 主要就是围绕着如何在并发过程中如何处理原子性、可见性和有序性这 3 个特征来建立的,通过解决这三个问题,可以解除缓存不一致的问题。而 volatile 跟可见性和有序性都有关。

1.原子性(Atomicity):

Java 中,对基本数据类型的读取和赋值操作是原子性操作,所谓原子性操作就是指这些操作是不可中断的,要做一定做完,要么就没有执行。 比如:

输入图片说明

  • i=2 是读取操作,必定是原子性操作,j=i 你以为是原子性操作,其实吧,分为两步,一是读取 i 的值,然后再赋值给 j,这就是 2 步操作了,称不上 原子操作,i++和 i = i + 1 其实是等效的,读取 i 的值,加 1,再写回主存,那就是 3 步操作了。所以上面的举例中,最后的值可能出现多种情况,就是因为满足不了原子性。只有简单的读 取,赋值是原子操作,还只能是用数字赋值,用变量的话还多了一步读取变量值的操作。有个例外是虚拟机规范中允许对 64 位数据类型(long 和 double),分为 2 次 32 为的操作来处理,但是最新 JDK 实现还是实现了原子操作的。
  • JMM 只实现了基本的原子性,像上面 i++那样的操作,必须借助于 synchronized 和 Lock 来保证整块代码的原子性了。线程在释放锁之前,必然会把 i 的值刷回到主存的。

2.可见性(Visibility):

  • 说到可见性,Java 就是利用 volatile 来提供可见性的。 当一个变量被 volatile 修饰时,那么对它的修改会立刻刷新到主存,当其它线程需要读取该变量时,会去内存中读取新值。而普通变量则不能保证这一点。
  • 其实通过 synchronized 和 Lock 也能够保证可见性,线程在释放锁之前,会把共享变量值都刷回主存,但是 synchronized 和 Lock 的开销都更大。

3.有序性(Ordering)

JMM 是允许编译器和处理器对指令重排序的,但是规定了 as-if-serial 语义,即不管怎么重排序,程序的执行结果不能改变。比如下面的程序段:

输入图片说明

  • 上面的语句,可以按照 A->B->C 执行,结果为 3.14,但是也可以按照 B->A->C 的顺序执行,因为 A、B 是两句 独立的语句,而 C 则依赖于 A、B,所以 A、B 可以重排序,但是 C 却不能排到 A、B 的前面。JMM 保证了重排序不会影响到单线程的执行,但是在多线程中却容 易出问题。

JMM 具备一些先天的有序性,即不需要通过任何手段就可以保证的有序性,通常称为 happens-before 原则

  1. 程序顺序规则: 一个线程中的每个操作,happens-before 于该线程中的任意后续操作
  2. 监视器锁规则:对一个线程的解锁,happens-before 于随后对这个线程的加锁
  3. volatile 变量规则: 对一个 volatile 域的写,happens-before 于后续对这个 volatile 域的读
  4. 传递性:如果 A happens-before B ,且 B happens-before C, 那么 A happens-before C
  5. start() 规则: 如果线程 A 执行操作 ThreadB_start()(启动线程 B) , 那么 A 线程的 ThreadB_start()happens-before 于 B 中的任意操作
  6. join() 原则: 如果 A 执行 ThreadB.join() 并且成功返回,那么线程 B 中的任意操作 happens-before 于线程 A 从 ThreadB.join() 操作成功返回。
  7. interrupt() 原则: 对线程 interrupt() 方法的调用先行发生于被中断线程代码检测到中断事件的发生,可以通过 Thread.interrupted() 方法检测是否有中断发生
  8. finalize() 原则:一个对象的初始化完成先行发生于它的 finalize() 方法的开始
  • 第 1 条规则程序顺序规则是说在一个线程里,所有的操作都是按顺序的,但是在 JMM 里其实只要执行结果一样,是允许重排序的,这边的 happens-before 强调的重点也是单线程执行结果的正确性,但是无法保证多线程也是如此。

  • 第 2 条规则监视器规则其实也好理解,就是在加锁之前,确定这个锁之前已经被释放了,才能继续加锁。

  • 第 3 条规则,就适用到所讨论的 volatile,如果一个线程先去写一个变量,另外一个线程再去读,那么写入操作一定在读操作之前。

  •  
  • 第 4 条规则,就是 happens-before 的传递性。

volatile 如何满足并发的三大特性

  • 如果一个变量声明成是 volatile 的,那么当我读变量时,总是能读到它的最新值,这里最新值是指不管其它哪个线程对该变量做了写操作,都会立刻被更新到主存里,我也能从主存里读到这个刚写入的值。也就是说 volatile 关键字可以保证可见性以及有序性。

从内存语义上来看

  • 当写一个 volatile 变量时,JMM 会把该线程对应的本地内存中的共享变量刷新到主内存
  • 当读一个 volatile 变量时,JMM 会把该线程对应的本地内存置为无效,线程接下来将从主内存中读取共享变量。

volatile 的两点内存语义能保证可见性和有序性,但是能保证原子性吗?

首先我回答是不能保证原子性,要是说能保证,也只是对单个 volatile 变量的读/写具有原子性,但是对于类似 volatile++这样的复合操作就无能为力了,比如下面的例子:

输入图片说明

  • 按道理来说结果是 10000,但是运行下很可能是个小于 10000 的值。有人可能会说 volatile 不是保证了可见性啊,一个线程对 inc 的修改,另外一个线程应该立刻看到啊!可是这里的操作 inc++是个复合操作啊,包括读取 inc 的值,对其自增,然后再写回主存。

  • 假设线程 A,读取了 inc 的值为 10,这时候被阻塞了,因为没有对变量进行修改,触发不了 volatile 规则。

  • 线程 B 此时也读读 inc 的值,主存里 inc 的值依旧为 10,做自增,然后立刻就被写回主存了,为 11。

  • 有人说,volatile 不是会使缓存行无效的吗?但是这里线程 A 读取到线程 B 也进行操作之前,并没有修改 inc 值,所以线程 B 读取的时候,还是读的 10。

  • 又有人说,线程 B 将 11 写回主存,不会把线程 A 的缓存行设为无效吗?但是线程 A 的读取操作已经做过了啊,只有在做读取操作时,发现自己缓存行无效,才会去读主存的值,所以这里线程 A 只能继续做自增了。

综上所述,在这种复合操作的情景下,原子性的功能是维持不了了。但是 volatile 在上面那种设置 flag 值的例子里,由于对 flag 的读/写操作都是单步的,所以还是能保证原子性的。

要想保证原子性,只能借助于 synchronized,Lock 以及并发包下的 atomic 的原子操作类了,即对基本数据类型的 自增(加 1 操作),自减(减 1 操作)、以及加法操作(加一个数),减法操作(减一个数)进行了封装,保证这些操作是原子性操作。

volatile 底层的实现机制

  • 如果把加入 volatile 关键字的代码和未加入 volatile 关键字的代码都生成汇编代码,会发现加入 volatile 关键字的代码会多出一个 lock 前缀指令。

lock 前缀指令实际相当于一个内存屏障,内存屏障提供了以下功能:

  • 1 重排序时不能把后面的指令重排序到内存屏障之前的位置
  • 2 . 使得本 CPU 的 Cache 写入内存
  • 3 . 写入动作也会引起别的 CPU 或者别的内核无效化其 Cache,相当于让新写入的值对别的线程可见。

输入图片说明

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文