爱进入，更爱自旋，乱谈Monitor.Enter究竟自旋了麽？（一）

作者：大豆子 | 来源：互联网 | 2023-05-18 13:20

写下标题，突然发觉有点淫荡了，把旋改成慰，一字之差，效果全然不同，性质也千差万别.淫者见淫，仁者未必仁。本文写作的初衷是探讨lock或者Monitor.Enter的实现是否用到了自旋，也即所谓的spi

写下标题，突然发觉有点淫荡了，把旋改成慰，一字之差，效果全然不同，性质也千差万别.淫者见淫，仁者未必仁。本文写作的初衷是探讨lock或者Monitor.Enter的实现是否用到了自旋，也即所谓的spinning。因为网上众多的意见和看法都是lock是C#/NET中关于线程同步的一种轻量级实现，类似于Windows临界区CriticalSection。那麽究竟有多像，像在哪里？由此也激发了一个偷窥者的那一点小小的兴趣。

我们首先来看看CriticalSection的概念与用法，本文在概念这一方面较大量地引用了valdok在CodeProject上的一文Fast critical sections with timeout，作者在这篇文章里实现了一个性能更好的CriticalSection,文中对spin和CriticalSection的分析非常到位，有兴趣的读者请自行前往阅读。

MSDN关于CriticalSection的部分描述如下，要注意着色部分：

A critical section object provides synchronization similar to that provided by a mutex object, except that a critical section can be used only by the threads of a single process. Event, mutex, and semaphore objects can also be used in a single-process application, but critical section objects provide a slightly faster, more efficient mechanism for mutual-exclusion synchronization (a processor-specific test and set instruction). Like a mutex object, a critical section object can be owned by only one thread at a time, which makes it useful for protecting a shared resource from simultaneous access. Unlike a mutex object, there is no way to tell whether a critical section has been abandoned.

从这一段我们得出一个结论临界区使用的线程同步技术和Mutex等不同，Mutex和Event多借助于WaitForSingleObject或WaitForXXXXObject(s)等待内核对象状态，涉及到内核态与用户态的切换，而临界区使用的技术是more efficient mechanism，是a processor-specific test and set instruction，是基于处理器命令的，其实这个技术的实现就是自旋。

再看valdok对临界区的一段描述，稍加修改翻译：

Minding all the above, we introduce critical sections. It's a hybrid. When you attempt to lock it (call EnterCriticalSection，调用EnterCriticalSection试图获得锁), the idea is to perform the following steps:

Check if this thread already owns the critical section. If it does, the lock/unlock is omitted (skip the rest). 先检查当前线程是否已经拥有临界区的锁。
Attempt to lock a dedicated variable via the interlocked instruction (similar to what we've done). If the lock succeeds, return (skip the rest). 通过处理器interlocked命令尝试锁住一个变量，如果成功则意味获得锁并返回。
Optionally, retry the second step a number of times. This can be enabled by calling InitializeCriticalSectionAndSpinCount instead of InitializeCriticalSection. This step is always skipped on single-processor machines. 调用InitializeCriticalSectionAndSpinCount 来初始化临界区的自旋次数。只在多处理器计算机上有效。
After we've tried all of the above, call a kernel-mode WaitXXXX function.如果上述步骤皆试过且依旧没有获得锁，则调用WaitXXXX进入内核态等待.

valdok在文中给了我们一段自旋的实现代码：

while (InterlockedCompareExchange(&nLockCount, 1, 0));

InterlockedCompareExchange是Interlocked函数家族的一员，凡冠以此前缀的函数都在处理器级别实现了对变量的操作同步（即使是多处理器情况下也如此，Interlocked会通过总线向其它处理器发送命令，告诉它们此时此刻只有我才能动），InterlockedCompareExchange函数会判断第一个参数与第三个参数是否相等，如果相等则将第二个参数复制给第一个参数，并返回原始值（这里就是0），调用InterlockedCompareExchange意味着只有第一次才生效，之后的调用都不会对nLockCount修改，返回值都是1，所以现在假设有两个线程同一时间分别执行这段代码，那麽将会只有一个线程退出while循环并继续下面的操作，即获得了临界区的锁，而另外一个线程则会无限循环，因为它那里InterlockedCompareExchange永远返回1==TRUE。这就是一个自旋的实现。不过这样的自旋如果没有退出循环的条件则意味着无限自旋和等待，所以真正的临界区肯定会有退出的条件，使用InitializeCriticalSectionAndSpinCount 初始化一个自旋次数就是一个条件，如果达到自旋次数且依旧没有获得锁，则直接WaitXXXX进入内核态。这时候我们再来看看valdok提供的一个类似EnterCriticalSection的代码实现就容易理解多了：

// Attempt spin-lock
for (DWORD dwSpin = 0; dwSpin {
if (PerfLockImmediate(dwThreadID))
return true;

YieldProcessor();
}

// Ensure we have the kernel event created
AllocateKernelSemaphore();

bool bVal = PerfLockKernel(dwThreadID, dwTimeout);
WaiterMinus();

return bVal;

PerfLockImmediate的代码：

inline bool PerfLockImmediate(DWORD dwThreadID)
{
return !_InterlockedCompareExchange((long*) &m_nLocker, dwThreadID, 0);
}

PerfLockKernel的部分代码：

switch (WaitForSingleObject(m_hSemaphore, dwWait))
        {
        case WAIT_OBJECT_0:
            bWaiter = false;
            break;
        case WAIT_TIMEOUT:
            bWaiter = true;
            break;
        default:
            TestSys(TRUE);
        }

这里插一句，究竟Interlocked为啥比WaitXXXX性能好？差距是多大？valdok说：

Interlocked operations cost us from tens to hundreds of processor cycles, whereas every kernel-mode call, including WaitForSingleObject and ReleaseMutex, for example, cost thousands of cycles, so that on multi-processor systems for short-time locking - spinning may be a preferred way to go.

现在，我们搞清楚了自旋的概念，是时候来瞧瞧Monitor.Enter和EnterCriticalSection是胞胎呢还仅仅是慕名模仿者呢？等会我们再弄，先吃饭去。

推荐阅读

function
brain是什么意思_brain怎么读_brain翻译_用法_发音_词组_同反义词_脑新东方在线英语词典

本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容，以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法，以及与brain相关的短语和词组。此外，还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]

蜡笔小新 2023-12-14 16:52:33
import
关于cuowu类的错误提示和使用AdjustmentListener的问题

本文讨论了一个关于cuowu类的问题，作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案，并给出了两个可能导致错误的原因。 ... [详细]

蜡笔小新 2023-12-13 22:09:56
import
Java学习笔记之面向对象编程（OOP）

本文介绍了Java学习笔记中的面向对象编程（OOP）内容，包括OOP的三大特性（封装、继承、多态）和五大原则（单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则）。通过学习OOP，可以提高代码复用性、拓展性和安全性。 ... [详细]

蜡笔小新 2023-12-13 08:44:30
io
clone的fork与pthread_create创建线程有何不同

本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境，其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时，子进程只是完全复制父进程的资源，这样得到的子进程独立于父进程，具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制，另外通过fork创建子进程系统开销很大。因此，在某些情况下，使用clone或pthread_create创建线程可能更加高效。 ... [详细]

蜡笔小新 2023-12-12 20:00:06
io
使用集算器将日志文件结构化，轻松使用SQL查询

本文介绍了一种轻巧方便的工具——集算器，通过使用集算器可以将文本日志变成结构化数据，然后可以使用SQL式查询。集算器利用集算语言的优点，将日志内容结构化为数据表结构，SPL支持直接对结构化的文件进行SQL查询，不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]

蜡笔小新 2023-12-11 13:27:46
io
云原生边缘计算之KubeEdge简介及功能特点

本文介绍了云原生边缘计算中的KubeEdge系统，该系统是一个开源系统，用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建，并为网络应用程序提供基础架构支持。同时，KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外，KubeEdge还支持跨平台工作，在私有、公共和混合云中都可以运行。同时，KubeEdge还提供数据管理和数据分析管道引擎的支持。最后，本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]

蜡笔小新 2023-12-14 16:49:01
function
如何使用Java获取服务器硬件信息和磁盘负载率

本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务，并获取服务器的磁盘信息，并将结果输出。然后在本地使用JS编写一个AJAX脚本，远程请求服务端的程序，得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]

蜡笔小新 2023-12-14 13:56:20
import
Java容器中的compareto方法排序原理解析

本文从源码解析Java容器中的compareto方法的排序原理，讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点，回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录，展示了整个讲解过程。 ... [详细]

蜡笔小新 2023-12-14 13:53:31
object
LeetCode笔记：剑指Offer 41. 数据流中的中位数（Java、堆、优先队列、知识点）

本文介绍了LeetCode剑指Offer 41题的解题思路和代码实现，主要涉及了Java中的优先队列和堆排序的知识点。优先队列是Queue接口的实现，可以对其中的元素进行排序，采用小顶堆的方式进行排序。本文还介绍了Java中queue的offer、poll、add、remove、element、peek等方法的区别和用法。 ... [详细]

蜡笔小新 2023-12-14 13:34:58
import
scrapy存入excel时，excel文件被反复擦除重写。文件大小始终不超过100k，请问这种情况改如何解决

怀疑是每次都在新建文件，具体代码如下 ... [详细]

蜡笔小新 2023-12-13 17:53:49
list
XML介绍与使用的概述及标签规则

本文介绍了XML的基本概念和用途，包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则，包括标签的尖括号和合法标识符的组成，标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读，读者可以对XML的基本知识有一个全面的了解。 ... [详细]

蜡笔小新 2023-12-13 17:39:50
range
不同优化算法的比较分析及实验验证

本文介绍了神经网络优化中常用的优化方法，包括学习率调整和梯度估计修正，并通过实验验证了不同优化算法的效果。实验结果表明，Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]

蜡笔小新 2023-12-13 16:05:14
list
SpringJdbcTemplate的使用详解

本文详细介绍了Spring的JdbcTemplate的使用方法，包括执行存储过程、存储函数的call()方法，执行任何SQL语句的execute()方法，单个更新和批量更新的update()和batchUpdate()方法，以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]

蜡笔小新 2023-12-13 14:27:11
function
浏览器中的异常检测算法及其在深度学习中的应用

本文介绍了在浏览器中进行异常检测的算法，包括统计学方法和机器学习方法，并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测，可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率，而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]

蜡笔小新 2023-12-12 16:22:39
io
深入理解Kafka服务端请求队列中请求的处理

本文深入分析了Kafka服务端请求队列中请求的处理过程，详细介绍了请求的封装和放入请求队列的过程，以及处理请求的线程池的创建和容量设置。通过场景分析、图示说明和源码分析，帮助读者更好地理解Kafka服务端的工作原理。 ... [详细]

蜡笔小新 2023-12-12 16:14:59

大豆子

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章