将数据写入文件：fflush()需要大量时间

发布于 2024-11-19 00:15:14 字数 499 浏览 6 评论 0原文

我有一个要求，其中我必须缓冲大量数据（以 GB 为单位）以供将来使用。由于没有足够的 RAM 来缓冲如此大量的数据，我决定将数据存储在文件中。

现在的陷阱是，当我将数据写入文件时，其他线程可能需要“缓冲”数据，因此每次向文件流写入内容时，我都必须刷新文件流。准确地说，数据是我缓冲为预先录制的数据的视频帧（如 TiVo）其他线程可能想也可能不想在任何给定时间点写入它，但当它们这样做时，它们会从文件中读取并处理帧。

在一般情况下，fwrite-fflush 组合需要大约 150 us，但偶尔（而且相当有规律），该组合需要超过 1.5 秒。我负担不起，因为我必须实时处理帧。

我在这里有很多问题：

需要登录才能够评论，你可以免费注册一个本站的账号。

网白 2024-11-26 00:15:14

至于#2：大多数现代文件系统使用 btree 方法来管理当今巨大硬盘中的目录和数据节点数量。与所有 B 树一样，它们有时需要平衡。当这种情况发生时，不得进行任何更改，这就是系统锁定的原因。通常，这不是什么大问题，因为操作系统有巨大的缓存，但你是一个会受到伤害的极端情况。

你能做些什么呢？有两种方法：

使用套接字进行通信并将最后 N 帧保留在 RAM 中（即永远不要将它们写入磁盘或使用独立进程将其写入磁盘）。
不要写入新文件，覆盖现有文件。由于所有数据块的位置都是预先知道的，因此在写入时 FS 中不会进行重组。它也会快一点。因此，我们的想法是创建一个大文件或使用原始分区，然后覆盖它。当您到达文件末尾时，返回到开头并重复。

缺点：

使用方法 1 时，您可能会丢失帧。此外，您必须绝对确保所有客户端都可以足够快地读取和处理数据，否则服务器可能会阻塞。

对于#2，您必须找到一种方法来告诉读者当前的“文件结尾”在哪里。

因此，也许混合方法是最好的：