当前位置：文江博客话题详情

为什么持有自旋锁时不能睡觉？

发布于 2024-10-12 18:14:37 字数 36 浏览 6 评论 0原文

在linux内核中，为什么不能在持有自旋锁的情况下休眠呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

静谧 2024-10-19 18:14:37

示例：您的驱动程序正在执行，并且刚刚取出了控制对其设备的访问的锁。保持锁定时，设备会发出中断，这会导致中断处理程序运行。中断处理程序在访问设备之前也必须获得锁。在中断处理程序中取出自旋锁是合法的事情；这是自旋锁操作不休眠的原因之一。但是，如果中断例程与最初取出锁的代码在同一处理器中执行，会发生什么情况？当中断处理程序正在旋转时，非中断代码将无法运行来释放锁。该处理器将永远旋转。

来源：http://www.makelinux.net/ldd3/chp-5 -sect-5.shtml

回复收藏 0 原文

冷情 2024-10-19 18:14:37

这并不是说你在持有自旋锁时不能睡觉。这样做是一个非常非常糟糕的主意。引用 LDD 的话：

因此，适用于自旋锁的核心规则是任何代码在持有自旋锁时都必须是原子的。它无法入睡；事实上，除了服务中断（有时甚至不这样做）之外，它不能以任何理由放弃处理器。

任何像上面提到的死锁都可能导致不可恢复的状态。另一种可能发生的情况是，自旋锁被锁定在一个 CPU 上，然后当线程休眠时，它会在另一个 CPU 上唤醒，从而导致内核恐慌。

回答 Bandicoot 的评论，在自旋锁上下文中，仅在单处理器可抢占内核的情况下才禁用抢占，因为禁用抢占可以有效防止竞争。

如果内核是在没有 CONFIG_SMP 的情况下编译的，但设置了 CONFIG_PREEMPT，则自旋锁只是禁用抢占，这足以防止任何竞争。对于大多数用途，我们可以将抢占视为等同于 SMP，而不必单独担心它。

http://www.kernel.org/pub /linux/kernel/people/rusty/kernel-locking/index.html

回复收藏 0 原文

荒路情人 2024-10-19 18:14:37

我认为这个邮件有一个清晰的答案：

由于自旋锁行为，进程在持有自旋锁时无法被抢占或睡眠。如果进程获取自旋锁并在释放它之前进入睡眠状态。获取自旋锁的第二个进程（或中断处理程序）将忙于等待。在单处理器机器上，第二个进程将锁定CPU，不允许第一个进程唤醒并释放自旋锁，以便第二个进程可以继续，这基本上是一个死锁。

回复收藏 0 原文

这样的小城市 2024-10-19 18:14:37

我不同意威廉的回应（他的例子）。他混合了两个不同的概念：抢占和同步。

中断上下文可以抢占进程上下文，因此如果两者共享资源，我们需要使用

spin_lock_irqsave()

(1) 禁用 IRQ (2) 获取锁。通过步骤 1，我们可以禁用中断抢占。

我认为这个主题很有说服力。 Sleep() 意味着一个线程/进程将 CPU 和上下文切换的控制权交给另一个线程/进程，而不释放自旋锁，这就是它错误的原因。

I disagree with William's response (his example). He's mixing two different concepts: preemption and synchronization.

An Interrupt Context could preempt a Process Context and thus if there a RESOURCE shared by the both, we need to use

spin_lock_irqsave()

to (1) disable the IRQ (2) acquire the lock. By step 1, we could disable interrupt preemption.

I think this thread is much convincing. Sleep() means a thread/process yields the control of the CPU and CONTEXT SWITCH to another, without releasing the spinlock, that's why it's wrong.

回复收藏 0 原文

空城旧梦 2024-10-19 18:14:37

关键点是在Linux内核中，获取自旋锁将禁用抢占。因此，在持有自旋锁时睡眠可能会导致死锁。

例如，线程A获取自旋锁。线程A在释放锁之前不会被抢占。只要线程A快速完成自己的工作并释放锁就没有问题。但是，如果线程 A 在持有锁的情况下休眠，则可以安排线程 B 运行，因为 sleep 函数将调用调度程序。线程 B 也可以获得相同的锁。线程 B 也禁用抢占并尝试获取锁。并且发生死锁。线程 B 永远不会获得锁，因为线程 A 持有该锁，并且线程 A 永远不会运行，因为线程 B 禁用抢占。

为什么首先要禁用抢占？我想这是因为我们不希望其他处理器上的线程等待太久。

回复收藏 0 原文

枯叶蝶 2024-10-19 18:14:37

另一个可能的解释是，在自旋锁上下文中，抢占被禁用。

回复收藏 0 原文

紫瑟鸿黎 2024-10-19 18:14:37

除了 willtate 提到的之外，假设进程在持有 spilock 时处于休眠状态。如果调度的新进程尝试获取相同的自旋锁，它将开始自旋以获得可用的锁。由于新进程不断旋转，因此无法调度第一个进程，因此锁永远不会释放，从而使第二个进程永远旋转，我们遇到了死锁。

回复收藏 0 原文

鱼忆七猫命九 2024-10-19 18:14:37

完全同意王楠的观点。
我想最重要的概念是“抢占”和“抢占”。 “调度”以及获取自旋锁时如何发生。
当获取自旋锁时，抢占被禁用（是否正确，我不知道，但假设它是正确的），这意味着计时器中断不能抢占当前自旋锁持有者，但当前自旋锁持有者仍然调用可睡眠内核函数和主动调用调度程序和运行“另一个任务”。
如果“另一个任务”碰巧想要获取与第一个自旋锁持有者相同的自旋锁，那么问题就来了：由于抢占已经被第一个自旋锁持有者禁用，“另一个任务”由第一个自旋锁持有者主动调用调度程序来调用，无法被抢占，所以它的自旋总是占用cpu，这就是死锁发生的原因。

回复收藏 0 原文

~没有更多了~