谈到『自旋锁』,可能大家会说,这有啥好讲的,不就是等待资源的线程"原地打转"嘛。嗯,字面理解的意思很到位,但能深入具体点吗?自旋锁的设计真就这么简单?
本文或者说本系列的目的,都是让大家不要停留在表面,而是深入分析,做到:
当多个线程想同时访问同一个资源时,就存在资源冲突,这时,大家最直接想到的就是加锁来互斥访问,加锁会有这么几个问题:
那么,如果有一种方式,使得等待的线程先短暂的等待一会儿,有可能有两种结果:
这就是锁的小优化:自旋锁! 自旋锁并不是真正的锁,而是让等待的线程先原地"小转"一下,小转一下,通常小转一下的实现方式很简单:
int SPIN_LOCK_NUM = 64; int i = 0; boolean wait = true; do { wait = // 尝试获取资源锁 } while (wait && (++i)
我们通过循环一定的次数来自旋。 \color{red}{但是我们也应该知道,不进入休眠而原地打转,是会一直消耗 CPU 资源的,因此,才有了自旋限制!}但是我们也应该知道,不进入休眠而原地打转,是会一直消耗CPU资源的,因此,才有了自旋限制!
看下面的JDK源码:
public final class Unsafe { public final int getAndSetInt(Object var1, long var2, int var4) { int var5; do { var5 = this.getIntVolatile(var1, var2); } while(!this.compareAndSwapInt(var1, var2, var5, var4)); return var5; } }
我们可以看到,CAS就是采用的自旋锁方式,持续的尝试读取最新的 volatile 修饰的变量的值,并尝试去用期望的值去比较,然后更新。
不过这里我们要注意,因为是无限循环,因此我们要保证占用资源的线程很快就能释放,而不是长时间占用(当然,因为这里的源码系统也设定了 int 型变量,因此,占用该变量的线程很快就会使用完而释放)。
啥?怎么会有死锁? 自旋锁虽然好用,若我们只是停留在上面的分析,那么还是很肤浅的;虽然自旋锁有很大的优势,但同样缺点也不少,除了上面说的,原地打转(忙等待)会一直消耗CPU资源,同时,还会有一个潜在的可能缺陷:死锁。
在聊死锁之前,我们需要先了解一下系统中断事件(大学课本里有这一章节,ASM汇编中也涉及到系统中断向量表):
中断是指,CPU正常运行期间,由于有内/外部事件,或者由程序预先安排的事件,引起CPU暂停当前工作,转而去处理该事件,当处理完该事件后再返回继续运行被中断(暂停)的程序。通常,操作系统将中断分为两类:外部中断(硬件中断)和内部中断(异常中断,即软件引起的);
例如:由IO设备引起的中断为硬件中断,比如,键盘输入,硬盘/光驱读写等;异常中断很好理解,比如 NullPointerException 等。
系统提供了一个API使得我们的程序能够向系统申请注册一个中断处理程序(例如:程序接收用户的输入事件)。
request_irq(unsigned int irq, irq_handler_t handler, unsigned long flags, const char *name, void *dev)
参数含义如下:
中断标志(flags):
调用 request_irq 成功时返回0,常见错误是 -EBUSY,表示给定的中断线已经在使用(没有指定IRQF_SHARED)。
注:
那这和死锁有何关系呢?额,下一小节会谈到。但这里之所有提到中断,是因为我们还要知道一件事,当系统产生中断,程序被暂停时,程序是不能进入休眠的,此时程序只能采用一种方式:自旋,来保证不会睡眠。
为何不能睡眠?这里就涉及到『中断上下文 context』!
上面说了,request_irq 可能引起睡眠,所以不允许在中断上下文中使用,也就是说,中断上下文不允许睡眠!
中断上下文:它与进程上下文不一样,中断上下文是内核正在执行ISR。ISR没有自己独立的栈,而是使用内核栈,大小一般是有限制的(32位是8KB大小)。同时,ISR是打断了正常的程序流程,因此必须保证ISR执行速度快。正因为要执行速度快,所以,中断上下文不允许睡眠,且不允许被阻塞!
大家可能会说了,执行速度快不允许睡眠,这解释不合理,我睡眠个1ms不行么?嗯,下面我们就来分析下不能睡眠的真正原因:
1.中断处理时,不会发生进程切换。
2.schedule 在切换进程时,会保存当前的进程上下文(CPU寄存器的值、状态、堆栈SP内容)以便以后恢复再运行。中断发生后,内核会保存当前被中断进程的上下文。在ISR中,是中断上下文,如果休眠或阻塞,则会调用 schedule,保存的进程上下文不是当前进程的上下文,所以不能在ISR中调用 schedule;
3.内核中 schedule 在进入时会判断是否处于中断上下文:
if(unlikely(in_interrupt()))) ..... crash!!!
4.中断 handler 会使用被中断的进程内核堆栈,但不会对其有任何影响,因为 handler用之前会保存,用完后会清除并恢复原貌;
5.处理中断上下文中,内核是不可抢占的,如果休眠,则内核....一定会被挂起,同样,你只能重启机器了;
所以,被中断的程序也不能睡眠!那么只能使用『自旋锁』来原地打转。
那还是没有说自旋为何会死锁?
自旋锁是不能递归,否则自己等待自己已经获取的锁,将会导致死锁!
一个线程获取了一个自旋锁,在执行这程中被中断处理程序打断,因此该线程只是暂停执行,并未退出,仍持有自旋锁;而中断处理程序尝试获取自旋锁而获取不到,只能自旋;这就造成一个事实:ISR拿不到自旋锁,导致自旋而无法退出,该线程被中断无法恢复执行至退出释放自旋锁,此时就造成了死锁,导致系统崩溃。
发生自旋锁死锁,往往因为单CPU这个临界资源发生了抢占,使得一方持有自旋锁被中断暂停,一方不断自旋来尝试获取自旋锁。因此,在多CPU架构下,两方如果分别运行在不同CPU上,是不会发生死锁的。
因此,自旋锁有几个重要特性需要掌握(精髓):
所以,根据以上总结一点:持有自旋锁的线程,不能因为任何原因而放弃CPU! 也因此基于上述问题,自旋也需要添加一个上限时间以防死锁。
linux上的自旋锁有三种实现:
以上就是Java 自旋锁(spinlock)相关知识总结的详细内容,更多关于Java 自旋锁(spinlock)的资料请关注其它相关文章!