热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

【并发】深度解析CAS原理与底层源码

【并发】深度解析CAS原理与底层源码什么是CAS?CAS案例分析一、不采用任何限制二、使用synchronized锁解决线程安全问题三、使用CAS解决线程安

【并发】深度解析CAS原理与底层源码

什么是 CAS?

CAS案例分析

一、不采用任何限制 

二、使用synchronized锁解决线程安全问题

三、使用CAS解决线程安全问题

(1)Unsafe的基本使用

(2)自定义的UnsafeFactory 

(3)Unsafe的关于CAS的API

(4)自定义一个CASLock锁工具类 

(5)CAS实现线程同步 

四、其它方式

CAS源码分析

Unsafe_CompareAndSwapInt

Atomic::cmpxchg 

CAS底层源码总结

CAS的缺点

ABA问题及其解决方案 

什么是ABA问题?

发生ABA问题的测试代码

ABA问题的解决方案

关于 AtomicStampedReference 的补充




【并发】深度解析CAS原理与底层源码


什么是 CAS?

CAS全称是(Compare And Swap,比较并交换),通常指的是这样一种原子操作(针对一个变量,首先比较它的内存值某个期望值是否相同,如果相同,就给它赋一个新值

我们用伪代码描述起来就是:

if(value == expectValue) {value = newValue;
}

以上伪代码描述了一个由比较赋值两阶段组成的复合操作。

而 CAS 可以看作是它们合并后的整体!一个不可分割的原子操作,并且其原子性是直接在硬件层面得到保障的。

CAS可以看做是乐观锁(对比数据库的悲观、乐观锁)的一种实现方式,我们稍后要讲的Java原子类中的递增操作(i++)就通过CAS自旋实现的

CAS是一种无锁算法,在不使用锁(没有线程被阻塞)的情况下实现多线程之间的变量同步!


CAS案例分析

我们先来看看CAS是怎么解决多线程并发问题的!


一、不采用任何限制 

这里要求开10个线程,每个线程执行1万次的“++操作”

public class Test {private volatile static int sum = 0;public static void main(String[] args) {for (int i = 0; i <10; i++) {Thread thread = new Thread(() -> {for (int j = 0; j <10000; j++) {sum++;}});thread.start();}try {Thread.sleep(3000);} catch (InterruptedException e) {e.printStackTrace();}// 30421System.out.println(sum);}
}

由于我们这里没有使用任务“限制”,线程之间没有同步关系,最后输出的结果肯定不是10万! 


二、使用synchronized锁解决线程安全问题

public class Test {private volatile static int sum = 0;static Object object = "";public static void main(String[] args) {for (int i = 0; i <10; i++) {Thread thread = new Thread(() -> {synchronized (object) {for (int j = 0; j <10000; j++) {sum++;}}});thread.start();}try {Thread.sleep(3000);} catch (InterruptedException e) {e.printStackTrace();}// 100000System.out.println(sum);}
}

显然,加锁之后,结果就是我们预计的那样,这种方案可以解决大多数场景。

虽然, synchronized 在JDK1.8的时候优化了很多,但是由于Java线程是与操作系统线程一一对应的。Java的线程的切换,需要涉及到操作系统用户态到内核态的切换,是一个很重的操作!!!而synchronized的使用就会导致这种上下文切换!!!


三、使用CAS解决线程安全问题

在 Java 中,CAS 操作是由 Unsafe 类提供支持的,该类定义了三种针对不同类型变量的 CAS 操做。


(1)Unsafe的基本使用

Java中的Unsafe的介绍与使用_面向鸿蒙编程的博客-CSDN博客https://blog.csdn.net/weixin_43715214/article/details/128260404这篇JavaGuide文章写得很好,可以看看 

Java 魔法类 Unsafe 详解 (javaguide.cn)https://javaguide.cn/java/basis/unsafe.html#unsafe-%E5%8A%9F%E8%83%BD不能通过new的方式去创建一个Unsafe对象,必须要通过反射


(2)自定义的UnsafeFactory 

在项目开发中,如果要用到Unsafe,一般要通过自定义一个Unsafe工厂类,去创建Unsafe对象。

public class UnsafeFactory {// 获取 Unsafe 对象public static Unsafe getUnsafe() {try {Field field = Unsafe.class.getDeclaredField("theUnsafe");field.setAccessible(true);return (Unsafe) field.get(null);} catch (Exception e) {e.printStackTrace();}return null;}// 获取字段的内存偏移量public static long getFieldOffset(Unsafe unsafe, Class clazz, String fieldName) {try {return unsafe.objectFieldOffset(clazz.getDeclaredField(fieldName));} catch (NoSuchFieldException e) {throw new Error(e);}}
}

我们可以看 Unsafe类 的源码,分别定义了Object、int、long类型的比较与交换

它们都是 native 方法,由 Java 虚拟机 提供具体实现,这意味着不同的 Java 虚拟机对它们的实现可能会略有不同。 

我们可以先研究一下这三个API


(3)Unsafe的关于CAS的API

public class CASTest {public static void main(String[] args) {Entity entity = new Entity();Unsafe unsafe = UnsafeFactory.getUnsafe();long offset = UnsafeFactory.getFieldOffset(unsafe, Entity.class, "x");// 12System.out.println(offset);boolean successful;// 4个参数分别是:对象实例、字段的内存偏移量、字段期望值、字段更新值// true 3successful = unsafe.compareAndSwapInt(entity, offset, 0, 3);System.out.println(successful + "\t" + entity.x);// true 5successful = unsafe.compareAndSwapInt(entity, offset, 3, 5);System.out.println(successful + "\t" + entity.x);// false 5successful = unsafe.compareAndSwapInt(entity, offset, 3, 8);System.out.println(successful + "\t" + entity.x);}
}class Entity{int x;
}

compareAndSwapInt(Object var1, long var2, int var4, int var5);


上述的参数分别是:对象实例字段内存偏移量字段期望值字段更新值

针对 entity.x 的 3 次 CAS 操作,分别试图将它从 0 改成 3、从 3 改成 5、从 3 改成 8。

其中前两次是成功的!最后一次失败了,返回false,因为字段的值已经在上一次CAS中更新为5,但是此时的期望值为3,不符,所以返回false。

偏移量怎么算来的??? 

Java中的对象在内存中是怎么去存储的?

以Entry为例,对象头占8个字节,指针占4个字节,假如对象中没有定义属性(空的),那么操作系统会再为其分配一个对其填充为4个字节,所以,换句话说,new一个对象最少需要16个字节

那这个例子中,Entry里面有一个变量x,所以x的偏移量就是12

再举一个例子,如下: 

class Entry {int x;int y;
}

x的偏移量为12,y为16


(4)自定义一个CASLock锁工具类 

// 工具类
public class CASLock {//加锁标记private volatile int state;private static final Unsafe UNSAFE;private static final long OFFSET;static {try {UNSAFE = UnsafeFactory.getUnsafe();// 偏移量OFFSET = UnsafeFactory.getFieldOffset(UNSAFE, CASLock.class, "state");} catch (Exception e) {throw new Error(e);}}// CAS操作,值为0,则更新为1public boolean cas() {return UNSAFE.compareAndSwapInt(this, OFFSET, 0, 1);}public int getState() {return state;}public void setState(int state) {this.state = state;}
}

(5)CAS实现线程同步 

public class Test {private volatile static int sum = 0;static CASLock casLock = new CASLock();public static void main(String[] args) {for (int i = 0; i <10; i++) {Thread thread = new Thread(() -> {for(;;){if(casLock.getState() == 0 && casLock.cas()) {try {for (int j = 0; j <10000; j++) {sum++;}} finally {// 改回0casLock.setState(0);}break;}}});thread.start();}try {Thread.sleep(3000);} catch (InterruptedException e) {e.printStackTrace();}// 100000System.out.println(sum);}
}

这里开了10个线程,同一时刻,只会有一个线程进入到如下逻辑里面


if(casLock.getState() == 0 && casLock.cas()) { ... }


其它的线程都会在此处“自旋”!

因为,当第一个线程进去后,它进行了cas操作,会将state值改为1,所以它们get到的state值都是1,不满足这里的 casLock.getState() == 0 条件。

故,这样也就实现了“无锁”的线程变量同步,避免了上下文切换,线程由用户态到内核态的切换。


四、其它方式

当然了,实现这个小案例的方式有很多。

我们这里只是为了讲CAS原理和源码,才会采用这种方式。像AtomicIntegerReentrantlock也都可以解决这个问题!


CAS源码分析


Unsafe_CompareAndSwapInt

Hotspot 虚拟机对compareAndSwapInt 方法的实现如下:  

/** unsafe.cpp* obj:对象* offset:对象偏移量* e:比较值 * x:更新值*/
UNSAFE_ENTRY(jboolean, Unsafe_CompareAndSwapInt(JNIEnv *env, jobject unsafe, jobject obj, jlong offset, jint e, jint x))UnsafeWrapper("Unsafe_CompareAndSwapInt");oop p = JNIHandles::resolve(obj);// 根据偏移量,计算value的地址jint* addr = (jint *) index_oop_from_field_offset_long(p, offset);// Atomic::cmpxchg(x, addr, e) cas逻辑 x:要交换的值 e:要比较的值// cas成功,返回期望值e,等于e,此方法返回true // cas失败,返回内存中的value值,不等于e,此方法返回falsereturn (jint)(Atomic::cmpxchg(x, addr, e)) == e;
UNSAFE_END

Atomic::cmpxchg 

核心逻辑在Atomic::cmpxchg方法中,这个根据不同操作系统和不同CPU会有不同的实现。

这里我们以 linux_64x 的为例

#atomic_linux_x86.inline.hpp
inline jint Atomic::cmpxchg (jint exchange_value, volatile jint* dest, jint compare_value) {//判断当前执行环境是否为多处理器环境int mp = os::is_MP();//LOCK_IF_MP(%4) 在多处理器环境下,为 cmpxchgl 指令添加 lock 前缀,以达到内存屏障的效果//cmpxchgl 指令是包含在 x86 架构及 IA-64 架构中的一个原子条件指令,//它会首先比较 dest 指针指向的内存值是否和 compare_value 的值相等,//如果相等,则双向交换 dest 与 exchange_value,否则就单方面地将 dest 指向的内存值交给exchange_value。//这条指令完成了整个 CAS 操作,因此它也被称为 CAS 指令。__asm__ volatile (LOCK_IF_MP(%4) "cmpxchgl %1,(%3)": "=a" (exchange_value): "r" (exchange_value), "a" (compare_value), "r" (dest), "r" (mp): "cc", "memory");return exchange_value;
}

里面的cmpxchgl指令,就是linux_64x 架构下的比较与交换!

Atomic::cmpxchg 这个函数最终返回值是 exchange_value

也就是说,如果 cmpxchgl 执行时 compare_value(要比较的值) dest指针指向的内存值相等,则会使得 dest指针指向内存值 变成 exchange_value,最终 eax寄存器存的compare_value 赋值给了exchange_value变量(返回旧值),即函数最终返回的值是原先的compare_value。此时,Unsafe_CompareAndSwapInt 的返回值 (jint)(Atomic::cmpxchg(x, addr, e)) == e 就是true,表明CAS成功

简单来说就是: 


如果compare_value与dest指针指向的内存值相等,“函数”返回值情况:
dest指针指向内存值为 新值
exchange_value为 旧值(用于比较)  


如果cmpxchgl执行时 compare_value 和 (dest) 不等则会把当前dest指针指向内存的值写入eax寄存器,最终输出时赋值给 exchange_value变量作为返回值,导致 (jint)(Atomic::cmpxchg(x, addr, e)) == e 得到false,表明CAS失败


 如果compare_value与dest指针指向的内存值不相等,“函数”返回值情况:

dest指针指向内存的值(赋值给exchange_value


可以用伪代码表示: 

if(compare_value(存在eax寄存器) == dest指针指向的内存值) {dest指针指向内存值 = exchange_value;exchange_value = compare_value(存在eax寄存器);return exchange_value;
} else {compare_value(存在eax寄存器) = dest指针指向内存值;exchange_value = compare_value(存在eax寄存器);return exchange_value;
}

CAS底层源码总结

不管是 Hotspot 中的 Atomic::cmpxchg 方法,还是 Java 中的 compareAndSwapInt 方法,它们本质上都是对相应平台的 CAS 指令的一层简单封装。

CAS 指令作为一种硬件原语,有着天然的原子性,这也正是 CAS 的价值所在!!!


CAS的缺点

CAS 虽然高效地解决了原子操作,但是还是存在一些缺陷的,主要表现在三个方面:


  1. 自旋 CAS 长时间地不成功,则会给 CPU 带来非常大的开销
  2. 只能保证一个共享变量原子操作
  3. ABA 问题

ABA问题及其解决方案 


什么是ABA问题?

当有多个线程一个原子类进行操作的时候,某个线程在短时间内将原子类的值A修改为B,又马上将其修改为A,此时其他线程不感知,还是会修改成功!


发生ABA问题的测试代码

public class ABATest {public static void main(String[] args) {AtomicInteger atomicInteger = new AtomicInteger(1);new Thread(()->{int value = atomicInteger.get();System.out.println("Thread1 read value: " + value);// 阻塞1sLockSupport.parkNanos(1000000000L);// Thread1通过CAS修改value值为3if (atomicInteger.compareAndSet(value, 3)) {System.out.println("Thread1 update from " + value + " to 3");} else {System.out.println("Thread1 update fail!");}},"Thread1").start();new Thread(()->{int value = atomicInteger.get();System.out.println("Thread2 read value: " + value);// Thread2通过CAS修改value值为2if (atomicInteger.compareAndSet(value, 2)) {System.out.println("Thread2 update from " + value + " to 2");// do somethingvalue = atomicInteger.get();System.out.println("Thread2 read value: " + value);// Thread2通过CAS修改value值为1if (atomicInteger.compareAndSet(value, 1)) {System.out.println("Thread2 update from " + value + " to 1");}}},"Thread2").start();}
}

运行结果 

显然,这边最后是可以讲1改为3,即该程序认为最后的这个1的状态是没有被修改的!


ABA问题的解决方案

数据库有个锁称为乐观锁,是一种基于数据版本实现数据同步的机制,每次修改一次数据,版本就会进行累加。

所以,ABA问题也可以通过版本号来解决!

public class AtomicStampedReferenceTest {public static void main(String[] args) {// 定义AtomicStampedReference Pair.reference值为1, Pair.stamp为1AtomicStampedReference atomicStampedReference = new AtomicStampedReference(1,1);new Thread(()->{int[] stampHolder = new int[1];int value = (int) atomicStampedReference.get(stampHolder);int stamp = stampHolder[0];System.out.println("Thread1 read value: " + value + ", stamp: " + stamp);// 阻塞1sLockSupport.parkNanos(1000000000L);// Thread1通过CAS修改value值为3,stamp是版本,每次修改可以通过+1保证版本唯一性if (atomicStampedReference.compareAndSet(value, 3,stamp,stamp+1)) {System.out.println("Thread1 update from " + value + " to 3");} else {System.out.println("Thread1 update fail!");}},"Thread1").start();new Thread(()->{int[] stampHolder = new int[1];int value = (int)atomicStampedReference.get(stampHolder);int stamp = stampHolder[0];System.out.println("Thread2 read value: " + value+ ", stamp: " + stamp);// Thread2通过CAS修改value值为2if (atomicStampedReference.compareAndSet(value, 2,stamp,stamp+1)) {System.out.println("Thread2 update from " + value + " to 2");// do somethingvalue = (int) atomicStampedReference.get(stampHolder);stamp = stampHolder[0];System.out.println("Thread2 read value: " + value+ ", stamp: " + stamp);// Thread2通过CAS修改value值为1if (atomicStampedReference.compareAndSet(value, 1,stamp,stamp+1)) {System.out.println("Thread2 update from " + value + " to 1");}}},"Thread2").start();}
}

运行结果 


关于 AtomicStampedReference 的补充

上面用到了 AtomicStampedReference类

public class AtomicStampedReference {private static class Pair {final T reference;// 版本号final int stamp;private Pair(T reference, int stamp) {this.reference = reference;this.stamp = stamp;}static Pair of(T reference, int stamp) {return new Pair(reference, stamp);}}private volatile Pair pair;......
}

AtomicMarkableReference 

AtomicMarkableReference 是 AtomicStampedReference 的简化版本!它不关心修改过几次,仅仅关心是否修改过。因此变量mark是boolean类型,仅记录值是否有过修改。

public class AtomicMarkableReference {private static class Pair {final T reference;final boolean mark;private Pair(T reference, boolean mark) {this.reference = reference;this.mark = mark;}static Pair of(T reference, boolean mark) {return new Pair(reference, mark);}}private volatile Pair pair;......
}

推荐阅读
  • Java高级工程师学习路径及面试准备指南
    本文基于一位朋友的PDF面试经验整理,涵盖了Java高级工程师所需掌握的核心知识点,包括数据结构与算法、计算机网络、数据库、操作系统等多个方面,并提供了详细的参考资料和学习建议。 ... [详细]
  • 使用R语言进行Foodmart数据的关联规则分析与可视化
    本文探讨了如何利用R语言中的arules和arulesViz包对Foodmart数据集进行关联规则的挖掘与可视化。文章首先介绍了数据集的基本情况,然后逐步展示了如何进行数据预处理、规则挖掘及结果的图形化呈现。 ... [详细]
  • 分布式计算助力链力实现毫秒级安全响应,确保100%数据准确性
    随着分布式计算技术的发展,其在数据存储、文件传输、在线视频、社交平台及去中心化金融等多个领域的应用日益广泛。国际知名企业如Firefox、Google、Opera、Netflix、OpenBazaar等均已采用该技术,推动了技术创新和服务升级。 ... [详细]
  • 本文探讨了Android系统中联系人数据库的设计,特别是AbstractContactsProvider类的作用与实现。文章提供了对源代码的详细分析,并解释了该类如何支持跨数据库操作及事务处理。源代码可从官方Android网站下载。 ... [详细]
  • 来自FallDream的博客,未经允许,请勿转载,谢谢。一天一套noi简直了.昨天勉强做完了noi2011今天教练又丢出来一套noi ... [详细]
  • 本文探讨了在不同场景下如何高效且安全地存储Token,包括使用定时器刷新、数据库存储等方法,并针对个人开发者与第三方服务平台的不同需求提供了具体建议。 ... [详细]
  • selenium通过JS语法操作页面元素
    做过web测试的小伙伴们都知道,web元素现在很多是JS写的,那么既然是JS写的,可以通过JS语言去操作页面,来帮助我们操作一些selenium不能覆盖的功能。问题来了我们能否通过 ... [详细]
  • Hadoop MapReduce 实战案例:手机流量使用统计分析
    本文通过一个具体的Hadoop MapReduce案例,详细介绍了如何利用MapReduce框架来统计和分析手机用户的流量使用情况,包括上行和下行流量的计算以及总流量的汇总。 ... [详细]
  • 本文旨在探讨Swift中的Closure与Objective-C中的Block之间的区别与联系,通过定义、使用方式以及外部变量捕获等方面的比较,帮助开发者更好地理解这两种机制的特点及应用场景。 ... [详细]
  • 本文探讨了使用普通生成函数和指数生成函数解决组合与排列问题的方法,特别是在处理特定路径计数问题时的应用。文章通过详细分析和代码实现,展示了如何高效地计算在给定条件下不相邻相同元素的排列数量。 ... [详细]
  • 本文探讨了一个Web工程项目的需求,即允许用户随时添加定时任务,并通过Quartz框架实现这些任务的自动化调度。文章将介绍如何设计任务表以存储任务信息和执行周期,以及如何通过一个定期扫描机制自动识别并加载新任务到调度系统中。 ... [详细]
  • java datarow_DataSet  DataTable DataRow 深入浅出
    本篇文章适合有一定的基础的人去查看,最好学习过一定net编程基础在来查看此文章。1.概念DataSet是ADO.NET的中心概念。可以把DataSet当成内存中的数据 ... [详细]
  • 如何高效学习鸿蒙操作系统:开发者指南
    本文探讨了开发者如何更有效地学习鸿蒙操作系统,提供了来自行业专家的建议,包括系统化学习方法、职业规划建议以及具体的开发技巧。 ... [详细]
  • H5技术实现经典游戏《贪吃蛇》
    本文将分享一个使用HTML5技术实现的经典小游戏——《贪吃蛇》。通过H5技术,我们将探讨如何构建这款游戏的两种主要玩法:积分闯关和无尽模式。 ... [详细]
  • 在1995年,Simon Plouffe 发现了一种特殊的求和方法来表示某些常数。两年后,Bailey 和 Borwein 在他们的论文中发表了这一发现,这种方法被命名为 Bailey-Borwein-Plouffe (BBP) 公式。该问题要求计算圆周率 π 的第 n 个十六进制数字。 ... [详细]
author-avatar
重新生活好吗
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有