FileInputStream.read(byte[]) 有什么问题？

发布于 2024-11-09 22:40:10 字数 614 浏览 7 评论 0原文

回应我对文件的回答-阅读问题，评论者表示FileInputStream.read(byte[])“不能保证填充缓冲区”。

File file = /* ... */  
long len = file.length();
byte[] buffer = new byte[(int)len];
FileInputStream in = new FileInputStream(file);
in.read(buffer);

（代码假定文件长度不超过 2GB）

除了 IOException 之外，还有什么可能导致 read 方法无法检索整个文件内容？

编辑：

代码的想法（以及我回答的问题的OP的目标）是将整个文件一次性读入一大块内存，这就是为什么buffer_size = 文件大小。

原文

In response to my answer to a file-reading question, a commenter stated that FileInputStream.read(byte[]) is "not guaranteed to fill the buffer."

File file = /* ... */  
long len = file.length();
byte[] buffer = new byte[(int)len];
FileInputStream in = new FileInputStream(file);
in.read(buffer);

(The code assumes that the file length does not exceed 2GB)

Apart from an IOException, what could cause the read method to not retrieve the entire file contents?

EDIT:

The idea of the code (and the goal of the OP of the question I answered) is to read the entire file into a chunk of memory in one swoop, that's why buffer_size = file_size.

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

万人眼中万个我 2024-11-16 22:40:11

人们已经讨论过在 FileInputStream 上读取假设没有填充缓冲区。事实上，在某些情况下这是现实：

如果您在“/dev/tty”或命名管道上打开 FileInputStream，则读取将仅返回当前可用的数据。其他设备文件可能具有相同的行为方式。（这些文件可能会返回 0L 作为文件大小。）
A 如果使用direct_io选项挂载文件系统，或者使用相应标志打开文件，则可以实现FUSE文件系统不完全填充读取缓冲区。

上述内容适用于 Linux，但其他操作系统和/或 Java 实现也可能存在类似情况。最重要的是，javadocs允许这种行为，如果您的应用程序认为它不会发生，您可能会遇到麻烦。

有一些第三方库实现了“完全阅读”行为；例如 Apache commons 提供 FileUtils.readFileToByteArray 或 IOUtils。 toByteArray 和类似的方法。如果您想要/需要这种行为，您应该使用这些库之一，或者自己实现它。

回复收藏 0 原文

说好的呢 2024-11-16 22:40:11

不保证填充缓冲区。

文件大小可能小于缓冲区，或者文件的其余部分可能小于缓冲区。

回复收藏 0 原文

又怨 2024-11-16 22:40:11

你的问题是自相矛盾的。无法保证它会读取整个缓冲区，即使在任何可以想象的情况下它都不会读取。没有任何保证，所以你不能假设它。

回复收藏 0 原文

夜还是长夜 2024-11-16 22:40:10

除了 IOException 之外，还有什么可能导致读取方法无法检索整个文件内容？

在我自己的 API 实现中，以及在我的家庭滚动文件系统上，我只需选择填充一半的缓冲区......开玩笑。

我的观点是，即使我没有开玩笑，从技术上讲这也不会是一个错误。这是方法契约的问题。本例中的合同（文档）是：

从此输入流中读取最多 b.length 字节的数据到字节数组中。

即，它不保证填充缓冲区。

根据 API 实现，也许根据文件系统，read 方法可能选择不填充缓冲区。这基本上是方法的契约所说的内容的问题。

底线：它可能有效，但不能保证有效。

回复收藏 0 原文

不顾 2024-11-16 22:40:10

什么可能导致读取方法
不检索整个文件内容？

例如，如果文件在文件系统上是碎片化的，并且低级实现知道它将必须等待 HD 寻找下一个碎片（相对于 CPU 操作来说，这需要花费大量时间），对于 read() 调用来说，返回部分缓冲区未填充的情况是有意义的，这样应用程序就有机会对收到的数据执行某些操作。

现在我不知道是否有任何实现实际上是这样工作的，但重点是您一定不能依赖于正在填充的缓冲区，因为它不受 API 契约的保证。

回复收藏 0 原文

夜未央樱花落 2024-11-16 22:40:10

好吧，首先你给自己制造了一个错误的二分法。一种完全正常的情况是缓冲区不会被填充，因为文件中没有留下那么多字节。这不是 IOException，但并不意味着整个文件的内容尚未被读取。

规范称该方法将返回 -1 表示流结束，或者将阻塞直到至少读取一个字节。 InputStream 的实现者可以根据他们认为合适的方式进行优化（例如，无论调用者选择的缓冲区大小如何，一旦数据包进入，TCP 流就可能返回数据）。 FileInputStream 可能会用一个块的数据填充缓冲区。作为调用者，您除了在方法返回 -1 之前一无所知，您需要继续阅读。