使用多个线程并发写入文件

发布于 2024-12-01 09:53:28 字数 602 浏览 1 评论 0原文

我有一个用户级程序，它使用标志 O_WRONLY|O_SYNC 打开文件。该程序创建 256 个线程，每个线程尝试将 256 个或更多字节的数据写入文件。我想要总共 1280000 个请求，使其总共约 300 MB 的数据。一旦完成 1280000 个请求，该计划就会结束。

我使用 pthread_spin_trylock() 来增加一个变量，该变量跟踪已完成的请求数。为了确保每个线程写入唯一的偏移量，我使用 pwrite() 并根据已写入的请求数计算偏移量。因此，在实际写入文件时，我不使用任何互斥体（这种方法是否确保数据完整性？）

当我检查 pwrite() 调用被阻止的平均时间以及相应的数字时（即平均 Q2C 时间——这是 BIO 完整生命周期的时间度量）使用 blktrace，我发现有明显的区别。事实上，给定 BIO 的平均完成时间远大于 pwrite() 调用的平均延迟。这种差异背后的原因是什么？由于 O_SYNC 确保数据在返回之前实际写入物理介质，这些数字不应该相似吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

秋意浓 2024-12-08 09:53:28

pwrite() 被认为是原子的，所以你应该是安全的......

关于你的系统调用和实际 BIO 之间的延迟差异，根据 kernel.org 上的手册页用于 open(2 ）：

POSIX 提供同步 I/O 的三种不同变体，
相应的
到标志 O_SYNC、O_DSYNC 和 O_RSYNC。目前（2.6.31），
仅限Linux
实现 O_SYNC，但 glibc 将 O_DSYNC 和 O_RSYNC 映射到
相同的数字
值为 O_SYNC。大多数 Linux 文件系统实际上并不
实施 POSIX
O_SYNC 语义，需要写入的所有元数据更新
位于磁盘上
返回用户空间时，但仅限 O_DSYNC 语义，
只需要
检索它所需的实际文件数据和元数据
磁盘由
系统调用返回的时间。

因此，这基本上意味着，使用 O_SYNC 标志，您尝试写入的全部数据不需要在系统调用返回之前刷新到磁盘，而只需足够的信息即可< em>从磁盘检索它...取决于您正在写入的内容，这可能比您打算写入磁盘的整个数据缓冲区要少得多，因此所有数据的实际写入数据将在稍后的时间发生，之后系统调用已完成，该过程已转移到其他事情。