当前位置：文江博客话题详情

Linux 中的管道会丢失数据吗？

发布于 2024-08-29 23:29:51 字数 22 浏览 5 评论 0原文

它可以包含的数据量是否有上限？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

无所谓啦 2024-09-05 23:29:51

除非机器崩溃，否则不会丢失数据。然而，很容易误用它并认为您正在丢失数据，要么是因为写入未能写入您请求的所有数据并且您没有检查返回值，要么是因为读取时出现了错误。

它可以容纳的最大数据量取决于系统 - 如果您尝试写入超过该数据，您将得到一个简短的写入，或者写入器将阻塞，直到有可用空间为止。 pipe(7) 手册页包含许多有关管道的有用信息，包括（至少在 Linux 上）缓冲区有多大。 Linux 有 4K 或 64K 的缓冲区，具体取决于版本。

编辑

Tim 提到了 SIGPIPE，这也是一个可能会丢失数据的潜在问题。如果读取器在读取其中的所有内容之前关闭管道，则未读的数据将被丢弃，并且写入器在写入更多内容或关闭管道时将收到 SIGPIPE 信号，表明这种情况已经发生。如果他们阻止或忽略 SIGPIPE，他们将收到 EPIPE 错误。这涵盖了保罗提到的情况。

PIPE_BUF 是一个常量，它告诉您原子写入缓冲区的限制。任何小于或等于此大小的写入都将完全成功或阻塞，直到完全成功（或者如果管道处于非阻塞模式，则给出 EWOULDBLOCK/EAGAIN）。它与内核管道缓冲区的实际大小无关，但显然缓冲区的大小必须至少为 PIPE_BUF 才能满足原子性保证。

回复收藏 0 原文

困倦 2024-09-05 23:29:51

当发生以下情况时，管道中的数据可能会丢失：

进程（写入器）将 n 个字节的数据写入管道，其中 n≤PIPE_BUF。此写入保证是原子的并且永远不会阻塞。
进程（读取器）仅读取 m＜n 字节的数据并退出。
作者不会尝试再次写入管道。

因此，内核管道缓冲区将包含 nm 个字节，当管道的所有句柄都关闭时，这些字节将丢失。编写器不会看到 SIGPIPE 或 EPIPE，因为它不再尝试写入管道。由于编写者永远不会知道管道包含会消失的剩余数据，因此可以认为该数据丢失了。

检测此问题的非标准方法是编写者定义超时并调用 FIONREAD ioctl 来确定管道缓冲区中剩余的字节数。

回复收藏 0 原文

猛虎独行 2024-09-05 23:29:51

如果您指的是在 shell 中使用 | 运算符，那么不会，它不会丢失数据。它只是将左侧标准输出流上的应用程序连接到右侧标准输入流上的应用程序。如果您在应用程序之间传输数据但未获得预期结果，请尝试使用 > 将标准输出从第一个应用程序重定向到文件，然后使用 < > 使用该文件作为第二个应用程序的标准输入。这样，您可以检查文件并确保数据以您期望的格式发送。

如果您指的是由 pipe 函数创建的管道，那么答案仍然是否定的。根据这个手册页，写入一个完整的管道将被阻塞，直到有足够的数据为止。读取，为写入数据腾出空间。它还指出，在 Linux 2.6.11 之前的版本中，管道的大小为 4KB，在 2.6.11 及更高版本中为 64kB。