热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

爱进入,更爱自旋,乱谈Monitor.Enter究竟自旋了麽?(一)

写下标题,突然发觉有点淫荡了,把旋改成慰,一字之差,效果全然不同,性质也千差万别.淫者见淫,仁者未必仁。本文写作的初衷是探讨lock或者Monitor.Enter的实现是否用到了自旋,也即所谓的spi

写下标题,突然发觉有点淫荡了,把旋改成慰,一字之差,效果全然不同,性质也千差万别.淫者见淫,仁者未必仁。本文写作的初衷是探讨lock或者Monitor.Enter的实现是否用到了自旋,也即所谓的spinning。因为网上众多的意见和看法都是lock是C#/NET中关于线程同步的一种轻量级实现,类似于Windows临界区CriticalSection。那麽究竟有多像,像在哪里?由此也激发了一个偷窥者的那一点小小的兴趣。

我们首先来看看CriticalSection的概念与用法,本文在概念这一方面较大量地引用了valdok在CodeProject上的一文Fast critical sections with timeout,作者在这篇文章里实现了一个性能更好的CriticalSection,文中对spin和CriticalSection的分析非常到位,有兴趣的读者请自行前往阅读。

 

MSDN关于CriticalSection的部分描述如下,要注意着色部分:

A critical section object provides synchronization similar to that provided by a mutex object, except that a critical section can be used only by the threads of a single process. Event, mutex, and semaphore objects can also be used in a single-process application, but critical section objects provide a slightly faster, more efficient mechanism for mutual-exclusion synchronization (a processor-specific test and set instruction). Like a mutex object, a critical section object can be owned by only one thread at a time, which makes it useful for protecting a shared resource from simultaneous access. Unlike a mutex object, there is no way to tell whether a critical section has been abandoned.

从这一段我们得出一个结论临界区使用的线程同步技术和Mutex等不同,Mutex和Event多借助于WaitForSingleObject或WaitForXXXXObject(s)等待内核对象状态,涉及到内核态与用户态的切换,而临界区使用的技术是more efficient mechanism,是a processor-specific test and set instruction是基于处理器命令的,其实这个技术的实现就是自旋。

再看valdok对临界区的一段描述,稍加修改翻译:

Minding all the above, we introduce critical sections. It's a hybrid. When you attempt to lock it (call EnterCriticalSection,调用EnterCriticalSection试图获得锁), the idea is to perform the following steps:

  1. Check if this thread already owns the critical section. If it does, the lock/unlock is omitted (skip the rest). 先检查当前线程是否已经拥有临界区的锁。
  2. Attempt to lock a dedicated variable via the interlocked instruction (similar to what we've done). If the lock succeeds, return (skip the rest). 通过处理器interlocked命令尝试锁住一个变量,如果成功则意味获得锁并返回。
  3. Optionally, retry the second step a number of times. This can be enabled by calling InitializeCriticalSectionAndSpinCount instead of InitializeCriticalSection. This step is always skipped on single-processor machines. 调用InitializeCriticalSectionAndSpinCount 来初始化临界区的自旋次数。只在多处理器计算机上有效。
  4. After we've tried all of the above, call a kernel-mode WaitXXXX function.如果上述步骤皆试过且依旧没有获得锁,则调用WaitXXXX进入内核态等待.

valdok在文中给了我们一段自旋的实现代码:

while (InterlockedCompareExchange(&nLockCount, 1, 0));

InterlockedCompareExchange是Interlocked函数家族的一员,凡冠以此前缀的函数都在处理器级别实现了对变量的操作同步(即使是多处理器情况下也如此,Interlocked会通过总线向其它处理器发送命令,告诉它们此时此刻只有我才能动),InterlockedCompareExchange函数会判断第一个参数与第三个参数是否相等,如果相等则将第二个参数复制给第一个参数,并返回原始值(这里就是0),调用InterlockedCompareExchange意味着只有第一次才生效,之后的调用都不会对nLockCount修改,返回值都是1,所以现在假设有两个线程同一时间分别执行这段代码,那麽将会只有一个线程退出while循环并继续下面的操作,即获得了临界区的锁,而另外一个线程则会无限循环,因为它那里InterlockedCompareExchange永远返回1==TRUE。这就是一个自旋的实现。不过这样的自旋如果没有退出循环的条件则意味着无限自旋和等待,所以真正的临界区肯定会有退出的条件,使用InitializeCriticalSectionAndSpinCount 初始化一个自旋次数就是一个条件,如果达到自旋次数且依旧没有获得锁,则直接WaitXXXX进入内核态。这时候我们再来看看valdok提供的一个类似EnterCriticalSection的代码实现就容易理解多了:

// Attempt spin-lock
for (DWORD dwSpin = 0; dwSpin {
    if (PerfLockImmediate(dwThreadID))
        return true;

    YieldProcessor();
}

// Ensure we have the kernel event created
AllocateKernelSemaphore();

bool bVal = PerfLockKernel(dwThreadID, dwTimeout);
WaiterMinus();

return bVal;

 

PerfLockImmediate的代码:

inline bool PerfLockImmediate(DWORD dwThreadID)
{
    return !_InterlockedCompareExchange((long*) &m_nLocker, dwThreadID, 0);
}

PerfLockKernel的部分代码:

switch (WaitForSingleObject(m_hSemaphore, dwWait))
        {
        case WAIT_OBJECT_0:
            bWaiter = false;
            break;
        case WAIT_TIMEOUT:
            bWaiter = true;
            break;
        default:
            TestSys(TRUE);
        }

 

这里插一句,究竟Interlocked为啥比WaitXXXX性能好?差距是多大?valdok说:

Interlocked operations cost us from tens to hundreds of processor cycles, whereas every kernel-mode call, including WaitForSingleObject and ReleaseMutex, for example, cost thousands of cycles, so that on multi-processor systems for short-time locking - spinning may be a preferred way to go.

 

现在,我们搞清楚了自旋的概念,是时候来瞧瞧Monitor.Enter和EnterCriticalSection是胞胎呢还仅仅是慕名模仿者呢?等会我们再弄,先吃饭去。


推荐阅读
  • 本文介绍了brain的意思、读音、翻译、用法、发音、词组、同反义词等内容,以及脑新东方在线英语词典的相关信息。还包括了brain的词汇搭配、形容词和名词的用法,以及与brain相关的短语和词组。此外,还介绍了与brain相关的医学术语和智囊团等相关内容。 ... [详细]
  • 本文讨论了一个关于cuowu类的问题,作者在使用cuowu类时遇到了错误提示和使用AdjustmentListener的问题。文章提供了16个解决方案,并给出了两个可能导致错误的原因。 ... [详细]
  • Java学习笔记之面向对象编程(OOP)
    本文介绍了Java学习笔记中的面向对象编程(OOP)内容,包括OOP的三大特性(封装、继承、多态)和五大原则(单一职责原则、开放封闭原则、里式替换原则、依赖倒置原则)。通过学习OOP,可以提高代码复用性、拓展性和安全性。 ... [详细]
  • 本文讨论了clone的fork与pthread_create创建线程的不同之处。进程是一个指令执行流及其执行环境,其执行环境是一个系统资源的集合。在调用系统调用fork创建一个进程时,子进程只是完全复制父进程的资源,这样得到的子进程独立于父进程,具有良好的并发性。但是二者之间的通讯需要通过专门的通讯机制,另外通过fork创建子进程系统开销很大。因此,在某些情况下,使用clone或pthread_create创建线程可能更加高效。 ... [详细]
  • 本文介绍了一种轻巧方便的工具——集算器,通过使用集算器可以将文本日志变成结构化数据,然后可以使用SQL式查询。集算器利用集算语言的优点,将日志内容结构化为数据表结构,SPL支持直接对结构化的文件进行SQL查询,不再需要安装配置第三方数据库软件。本文还详细介绍了具体的实施过程。 ... [详细]
  • 云原生边缘计算之KubeEdge简介及功能特点
    本文介绍了云原生边缘计算中的KubeEdge系统,该系统是一个开源系统,用于将容器化应用程序编排功能扩展到Edge的主机。它基于Kubernetes构建,并为网络应用程序提供基础架构支持。同时,KubeEdge具有离线模式、基于Kubernetes的节点、群集、应用程序和设备管理、资源优化等特点。此外,KubeEdge还支持跨平台工作,在私有、公共和混合云中都可以运行。同时,KubeEdge还提供数据管理和数据分析管道引擎的支持。最后,本文还介绍了KubeEdge系统生成证书的方法。 ... [详细]
  • 如何使用Java获取服务器硬件信息和磁盘负载率
    本文介绍了使用Java编程语言获取服务器硬件信息和磁盘负载率的方法。首先在远程服务器上搭建一个支持服务端语言的HTTP服务,并获取服务器的磁盘信息,并将结果输出。然后在本地使用JS编写一个AJAX脚本,远程请求服务端的程序,得到结果并展示给用户。其中还介绍了如何提取硬盘序列号的方法。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • LeetCode笔记:剑指Offer 41. 数据流中的中位数(Java、堆、优先队列、知识点)
    本文介绍了LeetCode剑指Offer 41题的解题思路和代码实现,主要涉及了Java中的优先队列和堆排序的知识点。优先队列是Queue接口的实现,可以对其中的元素进行排序,采用小顶堆的方式进行排序。本文还介绍了Java中queue的offer、poll、add、remove、element、peek等方法的区别和用法。 ... [详细]
  • 怀疑是每次都在新建文件,具体代码如下 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • 不同优化算法的比较分析及实验验证
    本文介绍了神经网络优化中常用的优化方法,包括学习率调整和梯度估计修正,并通过实验验证了不同优化算法的效果。实验结果表明,Adam算法在综合考虑学习率调整和梯度估计修正方面表现较好。该研究对于优化神经网络的训练过程具有指导意义。 ... [详细]
  • 本文详细介绍了Spring的JdbcTemplate的使用方法,包括执行存储过程、存储函数的call()方法,执行任何SQL语句的execute()方法,单个更新和批量更新的update()和batchUpdate()方法,以及单查和列表查询的query()和queryForXXX()方法。提供了经过测试的API供使用。 ... [详细]
  • 浏览器中的异常检测算法及其在深度学习中的应用
    本文介绍了在浏览器中进行异常检测的算法,包括统计学方法和机器学习方法,并探讨了异常检测在深度学习中的应用。异常检测在金融领域的信用卡欺诈、企业安全领域的非法入侵、IT运维中的设备维护时间点预测等方面具有广泛的应用。通过使用TensorFlow.js进行异常检测,可以实现对单变量和多变量异常的检测。统计学方法通过估计数据的分布概率来计算数据点的异常概率,而机器学习方法则通过训练数据来建立异常检测模型。 ... [详细]
  • 深入理解Kafka服务端请求队列中请求的处理
    本文深入分析了Kafka服务端请求队列中请求的处理过程,详细介绍了请求的封装和放入请求队列的过程,以及处理请求的线程池的创建和容量设置。通过场景分析、图示说明和源码分析,帮助读者更好地理解Kafka服务端的工作原理。 ... [详细]
author-avatar
大豆子
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有