热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

06.一文看懂并发编程中的锁

大家好,我是王有志。关注王有志,一起聊技术,聊游戏,从北漂生活谈到国际风云。相信你经常会听到读锁写锁,公平锁非公平锁,乐观锁悲观锁等五花八门的锁,那么每种锁有什么用呢?它们又有

大家好,我是王有志。关注王有志,一起聊技术,聊游戏,从北漂生活谈到国际风云。

相信你经常会听到读锁/写锁,公平锁/非公平锁,乐观锁/悲观锁等五花八门的锁,那么每种锁有什么用呢?它们又有什么区别呢?今天我们就一起聊聊并发编程中的各种锁。


关于锁的理论,他们都问什么?

问题其实不多,基本上都是围绕着锁的设计理论提问。常见的问题如下:


计算机中的锁,它到底是什么?

引用维基百科中锁的解释:


In computer science, a lock or mutex (from mutual exclusion) is a synchronization primitive: a mechanism that enforces limits on access to a resource when there are many threads of execution. A lock is designed to enforce a mutual exclusion concurrency control policy, and with a variety of possible methods there exists multiple unique implementations for different applications.


可以这么理解:锁用于保证并发环境中对共享资源访问的互斥,限制共享资源访问的同步机制

Tips



  • 本文中访问操作既包含读取变量,也包含修改变量;

  • 不断提到的共享资源在拓展内容中做了补充;

  • 同步和互斥,可以回顾关于线程你必须知道的8个问题(下);

  • mutex在计算机科学中被翻译为互斥互斥量,会大量出现。

画一个锁的简易模型:

模型不难理解,获取锁的线程进入临界区执行程序,访问共享资源,它描述了一种最简单的互斥锁模型。

Tips:临界区源自于操作系统进程调度的概念,是访问共享资源的程序片段


锁的分类

我们把在并发编程中经常出现的锁全部列出来:



  • 读锁,S锁,共享锁,写锁,X锁,独占锁,排他锁,读写锁

  • 公平锁,非公平锁

  • 乐观锁,悲观锁

  • 自旋锁,阻塞锁

  • 可重入锁,不可重入锁

看到这么多名字有没有头晕眼花?没关系,我们透过现象给它们分类,或许能帮助你理解:



  • 本质,指的是互斥与共享的本质;

    • 互斥:写锁,X锁,独占锁,排他锁;

    • 共享:读锁,S锁,共享锁;



  • 设计,指的是锁的设计方式;

    • 乐观锁,悲观锁;

    • 读写锁;



  • 特性,指的是本质上添加的特性;

    • 公平锁,非公平锁;

    • 自旋锁,阻塞锁;

    • 可重入锁,不可重入锁。



前面看到,锁的基础是提供线程间互斥的能力以保证访问共享资源的安全性,之后的发展中为了提升性能或适应不同场景而添加了各种各样的特性。

除此之外,你还会听过偏向锁,轻量级锁,重量级锁,它们归类到sychronized的状态会比较合适,会在下一篇中详细说明。至于分段锁,我也将它归类到锁的设计中,具体的我们放到ConcurrentHashMap中讨论。

Tips



  • 基于个人理解分类,只是为了更好的理解锁的本质与特性,欢迎指正;

  • 共享部分的划分并不准确,因为共享锁只与读操作共享,与写操作互斥;

  • 特性是在本质的基础上添加的,它们的关系像是车与改装车的关系。


读锁,写锁和读写锁

锁是为了保证并发访问的互斥,但所有的场景都需要互斥吗?

有时候,临界区只有读操作,使用互斥锁的话就很呆。因此诞生了共享锁,允许多个线程同时申请到共享锁。不过共享锁也限制了线程的操作范围,持有共享锁的线程只允许读取数据


读写锁

实际上,单纯使用共享锁没有太多意义,因为读取操作不产生并发安全问题。但是对只有读取操作的临界区使用互斥锁,有点“大材小用”,因此结合两者产生了“共享-互斥锁”,通常称呼为读写锁

读写锁的特点:



  • 允许多个线程申请读锁

  • 如果读锁已经被申请,需要等待读锁释放后才能申请写锁

  • 如果写锁已经被申请,需要等待写锁释放后才能申请读锁

总结一下:

换句话说,读写锁中只有两种情况多读或一写

Tips:Java中提供了读写锁ReentrantReadWriteLock,我们后面慢慢聊。


读写锁的优缺点

相较于单纯的互斥锁,读写锁保证了读取的并发量,提高了程序的性能。但它真的那么好吗?

陈硕老师在《Linux多线程服务端编程》 中提到了慎用读写锁,并说道:


读写锁(Readers-Writer lock,简写为rwlock)是个看上去很美的抽象。


并给出了4点理由:



  1. 开发过程中容易犯在持有read lock时修改数据的错误;

  2. 读写锁的实现比互斥锁复杂,如果控制粒度极小,互斥锁可能更快;

  3. 如果读锁不允许升级为写锁,会和non-recursive mutex一样,造成死锁;

  4. 读写锁会引起写饥饿。

Tips



  • recursive mutex和non-recursive mutex是POSIX规范的称呼,我们通常称为ReentrantLok和NonreentrantLock;

  • 《Linux多线程服务端编程》的Keyword:Linux多线程服务端编程

第1点和第2点比较容易理解,不过多解释,第3点在ReentrantReadWriteLock的部分和大家解释,我们今天来看第4点,读写锁引起的写饥饿。

如下,由于不断的获取读锁,导致线程t2虽然很早申请写锁,但要等到所有读线程都执行后才能获取到写锁,这就是写饥饿

TipsReentrantReadWriteLock存在写饥饿的情况,Java 8虽然进行了增强,但不是对ReentrantReadWriteLock增强。


公平锁与非公平锁

接下来是按照特性分类了,先来看最容易理解的功能--公平性。不知道咋回事,想起来张麻子了~~

并发环境中,大量线程是瞬间涌入的,当执行到临界区时,开始尝试获取互斥锁,虽然看似是同时请求,但实际上还是有一丢丢时间差距。

公平锁维护等待队列,当线程尝试获取锁时,如果等待队列为空,或当前线程位于队首,那么线程就持有锁,否则添加到队尾,按照FIFO的顺序出队

非公平锁,线程直接尝试获取锁,失败后再进入等待队列。

Tips



  • 不熟悉队列的可以看我写的另一个系列:数据结构:栈和队列;

  • Java中ReentrantLock的“公平模式”和“非公平模式”的都借助了AQS。


公平锁与非公平锁的比较

公平锁严格按照申请顺序获取锁,每个线程都有机会获取锁;非公平锁允许直接抢占,无需判断等待队列是否有等待线程。

对于非公平锁来说,如果就是那么“寸”,等待队列队首的线程每次尝试获取锁时,都被其它线程“截胡”了,那么队列中的线程就永远无法获取锁,这就是线程饥饿

那么非公平锁有优点吗?


等待队列为空

以Java中ReentrantLock的公平锁FairSync和非公平锁NonfairSync加锁过程为例:

根据算法复杂度分析,以图中的内容来估算,FairSync的加锁时间是NonfairSync的两倍,加锁速度上非公平锁加锁速度更快

Tips:如果不熟悉算法复杂度,可以看预备知识:算法的复杂度分析。


等待队列非空

等待队列非空时,尝试获取公平锁的线程进入等待队列,轮到时唤醒该线程;对于非公平锁来说,如果抢占成功,直接执行程序,无需进入等待队列后等待唤醒,如果抢占失败,则进入等待队列。

最后,做个总结:

| / | 优点 | 缺点 |

| : -------- : | : ---------------------------------- : | :------------------------------: |

| 公平锁 | 每个线程都有执行的机会 | 加锁慢,可能需要额外的唤醒操作 |

| 非公平锁 | 加锁快,抢占成功无需额外的唤醒操作 | 线程饥饿 |


悲观锁与乐观锁

我把悲观锁和乐观锁分到了锁的设计类别中,我们先来了解悲观锁和乐观锁,再来看我这么分类的理由。


什么是悲观锁?

悲观锁(Pessimistic Locking):认为并发访问共享资源总是会发生修改,因此在进入临界区前进行加锁操作,退出临界区后进行解锁

根据上面的描述,几乎所有的锁都可以划分到悲观锁的范畴。那么共享锁算不算悲观锁?

我认为共享锁(读锁,S锁,共享锁)也是悲观锁,有2个理由:



  • 共享锁总是在访问临界区前加锁,退出后解锁

  • 共享锁只与读操作共享,与写操作互斥

悲观锁是计算机领域最常见的同步机制,数据库中的行锁,表锁,Java中的synchronized等都是悲观锁。


什么是乐观锁?

乐观锁(Optimistic Locking):认为并发访问共享资源不会发生修改,因此无需加锁操作,真正发生修改准备提交数据前,会检查该数据是否被修改

与悲观锁相反,乐观锁认为并发访问不会发生修改,因此允许线程“长驱直入”,如果发生了修改要怎么处理?


如何实现乐观锁?

乐观锁(乐观并发控制,Optimistic Concurrency Control)由孔祥重教授(华裔,台湾省出生的美国计算机科学家)提出,并为乐观锁设计了4个阶段:



  • 读取,读取数据,系统派发时间戳;

  • 修改,修改数据,此时修改尚未提交;

  • 校验,校验数据是否被其他读取或写入;

  • 提交/回滚:未发生修改/写入,提交数据,发生修改/写入,即产生冲突时,回滚数据。

如果按照以上4个步骤实现乐观锁会有什么问题么?

如果在校验和提交阶段发生线程切换,会导致值的覆盖。通常了为了保证校验和提交操作的原子性,会借助CPU提供的CAS并发原语来保证。


什么是CAS?

CAS(Compare And Swap)指的是比较并替换,虽然是两个操作,但却是一条原子指令。

Tips:《Intel® 64 and IA-32 Architectures Software Developer’s Manual》2A中描述,Intel和IA-32架构使用的是CMPXCHG指令,即Compare and Exchange。

CAS操作3个数:



  • V,内存原值

  • A,预期原值

  • B,修改的值

其过程可以简单描述为:



  • 读取需要修改的内存原值V;

  • 比较内存原值V与预期原值A;

  • 如果$V=A$,则修改V的值为B,否则不执行任何操作。

好了,目前解决了原子操作的问题,是不是可以愉快的实现乐观锁了?别急,我们再看另一种情况:


ABA问题

线程t1,t2和t3都读取V的值,线程t2和t3先后修改V的值,V的变化轨迹:$A \rightarrow B \rightarrow A$。

虽然对于线程t1来说,修改的还是A,看起来好像没有问题,但真正的ABA问题可比上面的复杂多了。我们举个例子,假设有单向连表实现的栈$A \rightarrow B \rightarrow C \rightarrow D$:


解决ABA问题

最常用的手段是,为数据添加版本,比较数据的同时也要对版本号进行比较,修改数据时,同时更新版本号

这里举个最常用的通过数据库实现的乐观锁:

-- 查询库存信息
select book_id, book_count, version from book where book_id = #{bookId};
-- 程序计算扣减库存操作
......
-- 更新数据库库存
update book set book_count = #{bookCount}, version = version + 1 where book_id = #{bookId} and version = #{version}

Tips:Java提供了AtomicStampedReference来解决CAS带来的ABA问题。


选择乐观锁还是悲观锁?

通常,我们认为乐观锁的性能优于悲观锁,因为悲观锁的粒度会更粗,而乐观锁的竞争只发生在产生冲突时

一般,会在读多写少的场景使用乐观锁,这样减少加锁/解锁的次数,提高系统的吞吐量;而在写多读少的场景选择悲观锁,如果经常产生冲突,乐观锁需要不断的回滚(或其他方式),反而会降低性能

另外,CAS指令只保证对一个共享变量的原子操作,当需要操作多个共享变量时,无法保证多个CAS操作的原子性。

最后,乐观锁需要自行实现,往往设计逻辑比较复杂,如果本身业务逻辑就已经很复杂了,那么首要保证的是正确的业务逻辑,然后再考虑性能。

Tips:CAS是实现乐观锁的关键技术,但使用CAS并不等于使用乐观锁。例如ReentrantLock中使用了compareAndSet,但它是悲观锁。


自旋锁和阻塞锁

自旋锁(Spin Lock)和阻塞锁都是互斥锁,我们所说的自旋和阻塞是对未抢占到锁的线程来说的:



  • 自旋锁中,线程未获取锁,不会进入休眠,而是不断的尝试获取锁;

  • 阻塞锁中,线程未获取锁,进入休眠状态。

也就是说,阻塞锁存在休眠到唤醒的过程,而自旋锁只需要执行自旋逻辑。什么场景该使用自旋锁呢?

假设我们只有两个线程t1和t2,t1进入临界区,t2进入自旋,t2自旋的耗时应当与t1在临界区的执行时间相近。

如果临界区执行时间非常短,自旋耗时远小于一次休眠与唤醒,此时使用自旋锁的的代价会比阻塞锁小很多。如果临界区执行时间很长,与其让自旋锁耗尽CPU时间片,倒不如让给其它线程使用。

我们实现一个简单的自旋逻辑:

int count = 0;
while(!lock.tryLock() && count <10) {
count ++;
}

Tips:单核服务器就不要使用自旋锁了。


可重入锁和不可重入锁

可重入锁指的是同一线程可以对其多次加锁,可重入锁的特性和递归很相似,因此POSIX中称这种锁为递归锁。


不可重入锁会造成死锁?

为什么要实现锁的可重入呢?假设有不可重入锁lock,我们执行一段递归删除文件夹下文件的逻辑:

public void deleteFile(File directory) {
if(lock.tryLock()) {
File[] files = directory.listFiles();
for (File subFile : files) {
if(file.isDirectory()) {
deleteFile(subFile);
} else {
file.delete();
}
}
}
}

当遇到第一个子文件夹时,执行lock.tryLock会被阻塞,因为lock已经被持有了,这时候就产生了死锁。

可重入锁的实现一般要在内部维护计数器,每次进入可重入锁时计数器加1,退出时计数器减1,进入和退出的次数要匹配


结语

到这里就把Java常用到的锁的基础知识和设计思想介绍完了,希望通过这篇文章,小伙伴对这些五花八门的锁有更清晰的认知。

其实总结起来,锁的基础功能是保证并发的安全(可以理解为互斥),再此基础上诞生的公平锁/非公平锁,悲观锁/乐观锁,自旋锁/阻塞锁的目的是为了提升锁的性能,而可重入锁的出现是为了解决重入带来的死锁问题(或许是为了方便开发者解决死锁的问题)

大部分的锁都能在Java中找到它们的实现:



  • 公平锁:ReentrantLock#FairSync

  • 非公平锁:ReentrantLock#NonfairSync

  • 悲观锁:synchronizedReentrantLock

  • 可重入锁:synchronizedReentrantLock

  • 读写锁:ReentrantReadWriteLock

我会在未来的文章中和大家分享对它们设计思想的理解。


拓展内容

补充一些计算机基础的相关内容。


共享内存

并发编程领域存在两种基本通信模型模型:



  • 共享内存(Shared Memory),指的是多线(进)程运行在不同核心上,任何核心缓存上的数据修改后,刷新到主内存后,其他核心更新自己的缓存;

  • 消息传递(Message Passing)

传统的面向对象编程语言采用的是共享内存的方式进行线程间通信,如:Java,C++等,但Java可以通过Akka实现Actor模型的消息传递。

近年来的“搅局者”(存疑)Go语言则是消息传递的忠实拥趸,在《Go Proverbs》中第一句便是:


Don't communicate by sharing memory, share memory by communicating.


不要通过共享内存来通信,要通过通信来共享内存

Tips:近年来“编程语言哲学”比较普遍,前有Python大名鼎鼎的《The Zen of Python》,后来者Go也搞了《Go Proverbs》。



好了,今天就到这里了,Bye~~



推荐阅读
  • POJ 2482 星空中的星星:利用线段树与扫描线算法解决
    在《POJ 2482 星空中的星星》问题中,通过运用线段树和扫描线算法,可以高效地解决星星在窗口内的计数问题。该方法不仅能够快速处理大规模数据,还能确保时间复杂度的最优性,适用于各种复杂的星空模拟场景。 ... [详细]
  • 兆芯X86 CPU架构的演进与现状(国产CPU系列)
    本文详细介绍了兆芯X86 CPU架构的发展历程,从公司成立背景到关键技术授权,再到具体芯片架构的演进,全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]
  • 在多线程并发环境中,普通变量的操作往往是线程不安全的。本文通过一个简单的例子,展示了如何使用 AtomicInteger 类及其核心的 CAS 无锁算法来保证线程安全。 ... [详细]
  • 探讨如何在Go语言中高效地处理大规模切片的去重操作,特别是针对百万级数据量的场景。 ... [详细]
  • 优化后的标题:Apache Cassandra数据写入操作详解
    本文详细解析了 Apache Cassandra 中的数据写入操作,重点介绍了 INSERT 命令的使用方法。该命令主要用于将数据插入到指定表的列中,其基本语法为 `INSERT INTO 表名 (列1, 列2, ...) VALUES (值1, 值2, ...)`。通过具体的示例和应用场景,文章深入探讨了如何高效地执行数据写入操作,以提升系统的性能和可靠性。 ... [详细]
  • 在《Cocos2d-x学习笔记:基础概念解析与内存管理机制深入探讨》中,详细介绍了Cocos2d-x的基础概念,并深入分析了其内存管理机制。特别是针对Boost库引入的智能指针管理方法进行了详细的讲解,例如在处理鱼的运动过程中,可以通过编写自定义函数来动态计算角度变化,利用CallFunc回调机制实现高效的游戏逻辑控制。此外,文章还探讨了如何通过智能指针优化资源管理和避免内存泄漏,为开发者提供了实用的编程技巧和最佳实践。 ... [详细]
  • 在HTML布局中,即使将 `top: 0%` 和 `left: 0%` 设置为元素的定位属性,浏览器中仍然会出现空白填充。这个问题通常与默认的浏览器样式、盒模型或父元素的定位方式有关。为了消除这些空白,可以考虑重置浏览器的默认样式,确保父元素的定位方式正确,并检查是否有其他CSS规则影响了元素的位置。 ... [详细]
  • 本文深入解析了Java 8并发编程中的`AtomicInteger`类,详细探讨了其源码实现和应用场景。`AtomicInteger`通过硬件级别的原子操作,确保了整型变量在多线程环境下的安全性和高效性,避免了传统加锁方式带来的性能开销。文章不仅剖析了`AtomicInteger`的内部机制,还结合实际案例展示了其在并发编程中的优势和使用技巧。 ... [详细]
  • Golomb 编码是一种高效的变长编码技术,专门用于整数的压缩。该方法通过预定义的参数 \( M \) 将输入整数分解为商 \( q \) 和余数 \( r \) 两部分。具体而言,输入整数除以 \( M \) 得到商 \( q \) 和余数 \( r \),其中商 \( q \) 采用一元编码表示,而余数 \( r \) 则使用二进制编码。这种编码方式在数据压缩和信息传输中具有显著的优势,特别是在处理具有特定概率分布的数据时表现出色。 ... [详细]
  • 本文详细介绍了在 SQL Server 2005 中优化和实现分页存储过程的方法。通过创建一个名为 `[dbo].[GetUsers]` 的存储过程,该过程接受两个参数:`@RowIndex`(当前指定的页数)和 `@RecordCount`(每页显示的记录数)。文章不仅提供了具体的代码示例,还深入探讨了性能优化技巧,包括索引使用和查询优化策略,以提高分页查询的效率和响应速度。 ... [详细]
  • 投融资周报 | Circle 达成 4 亿美元融资协议,唯一艺术平台 A 轮融资超千万美元 ... [详细]
  • 本文介绍了几种常用的图像相似度对比方法,包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点,适用于不同的应用场景。 ... [详细]
  • 该楼层疑似违规已被系统折叠隐藏此楼查看此楼错误72error:ErroropeningoutputfileC:Users林鑫辰AppDataLocalTemptmpxft_0000 ... [详细]
author-avatar
_韩文清_霸图V
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有