如何在 UNIX 上实际查找进程死锁原因？

发布于 2024-12-12 10:47:45 字数 369 浏览 0 评论 0原文

在unix上，一个进程卡住了，您怀疑可能是死锁，找出死锁的原因以及如何消除和避免它？

我知道死锁的4个条件：

互斥：一次最多可以将一种资源分配给一个进程（不共享）。
保持并等待：允许持有资源的处理请求另一个资源。
无抢占：进程必须释放其资源；它们不能被夺走。
循环等待：必须存在一个进程链，使得链中的每个成员都在等待链中下一个成员所持有的资源。

但是，它们是理论上的，如何在 UNIX 上实际确定死锁？只看到一个进程不取得进展？如何查找哪部分代码导致了死锁以及原因？如果允许使用工具，可以使用什么？

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

緦唸λ蓇 2024-12-19 10:47:46

使用调试器。

调试死锁的快速提示

或这个简单的：

如何使用 gdb 查找死锁场景

回复收藏 0 原文

明媚殇 2024-12-19 10:47:45

还有 Valgrind 的 Helgrind 工具：Helgrind：线程错误检测器< /强>

Helgrind 是一个 Valgrind 工具，用于检测使用 POSIX pthreads 线程原语的 C、C++ 和 Fortran 程序中的同步错误。
POSIX pthreads 中的主要抽象是：一组共享公共地址空间的线程、线程创建、线程加入、线程退出、互斥体（锁）、条件变量（线程间事件通知）、读写锁、自旋锁、信号量和屏障。
Helgrind 可以检测三类错误，这些错误将在接下来的三节中详细讨论：
滥用 POSIX pthreads API< /a>.

锁排序问题引起的潜在死锁.
数据争用 - 无需访问内存足够的锁定或同步。

此类问题通常会导致不可重现的、与时间相关的崩溃、死锁和其他不当行为，并且很难通过其他方式找到。

Helgrind 知道所有 pthread 抽象并尽可能准确地跟踪它们的效果。在 x86 和 amd64 平台上，它理解并部分处理因使用 LOCK 指令前缀而产生的隐式锁定。

当您的应用程序仅使用 POSIX pthreads API 时，Helgrind 效果最佳。但是，如果您想使用自定义线程原语，您可以使用 helgrind.h 中定义的 ANNOTATE_* 宏向 Helgrind 描述它们的行为。此功能是在 Valgrind 3.5.0 版本中添加的，并且被认为是实验性的。