当前位置：文江博客话题详情

linux-kernel linux-device-driver smp

为什么跨 CPU 时块 I/O 完成需要这么长时间？

发布于 2024-08-14 11:47:01 字数 736 浏览 6 评论 0原文

我正在尝试从 Linux 块驱动程序中榨取高端存储设备的最大性能。目前让我有点困惑的一个问题是：如果用户任务在一个 CPU 上启动 I/O 操作（读或写），而设备中断发生在另一个 CPU 上，那么我会产生大约 80 微秒的延迟任务恢复执行。

我可以使用 O_DIRECT 针对原始块设备看到这一点，因此这与页面缓存或文件系统无关。驱动程序使用 make_request 来接收操作，因此它没有请求队列，也不使用任何内核 I/O 调度程序（您必须相信我，这样速度更快）。

我可以向自己证明，问题发生在一个 CPU 上调用 bio_endio 和在另一个 CPU 上重新安排任务之间。如果任务在同一个 CPU 上，则启动速度非常快，如果任务在另一个物理 CPU 上，则需要更长的时间 - 在我当前的测试系统（Intel 5520 [NUMA] 芯片组上的 x86_64）上通常要长约 80 微秒）。

通过将进程和 IRQ cpu 亲和力设置为同一物理 CPU，我可以立即使性能加倍，但这不是一个好的长期解决方案 - 我宁愿能够获得良好的性能，无论 I/O 源自何处。而且我只有一个 IRQ，因此我一次只能将其引导到一个 CPU——如果许多线程在许多 CPU 上运行，那就不好了。

我可以在 Centos 5.4 的 2.6.18 到主线 2.6.32 的内核上看到这个问题。

所以问题是：如果我从另一个 CPU 调用 bio_endio，为什么用户进程需要更长的时间才能恢复？这是调度程序的问题吗？有什么办法可以消除或降低延迟吗？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

穿透光 2024-08-21 11:47:01

如果您在特定 CPU 上完成 I/O，则该处理器可以立即开始在新线程上工作 - 如果您在请求它的线程所在的同一处理器上完成 I/O，则下一个线程很可能成为你完成 i/o 的人。

另一方面，如果您在不同的处理器上完成，请求 i/o 的线程将不会立即运行 - 它必须等到当前正在执行的任何程序完成其量程或以其他方式放弃 CPU。

据我了解。

回复收藏 0 原文

陪我终i 2024-08-21 11:47:01

这可能只是从完成 BIOS 的 CPU 向计划任务的 CPU 发出 IPI 所固有的延迟 - 要测试这一点，请尝试使用 idle=poll 启动。

回复收藏 0 原文

怎樣才叫好 2024-08-21 11:47:01

此补丁刚刚发布到 LKML，实现了 块设备层的QUEUE_FLAG_SAME_CPU，其描述为：

添加一个标志以使请求完成
提交请求的CPU。这
标志意味着QUEUE_FLAG_SAME_COMP。经过
默认关闭。

听起来这可能正是您所需要的......

回复收藏 0 原文

二智少女猫性小仙女 2024-08-21 11:47:01

看来我有点误解了这个问题：它似乎与缓存未命中有关；当处理中断的 cpu 不是启动 i/o 的 cpu 时，cpu 的利用率可以达到 100%，然后一切都会变慢，给人的印象是 cpu 之间的通信存在很长的延迟。

感谢大家的想法。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

留蓝

文章 0 评论 0

18790681156

文章 0 评论 0

zach7772

文章 0 评论 0

Wini

文章 0 评论 0

ayeshaaroy

文章 0 评论 0

初雪

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文