当前位置：文江博客话题详情

Python 会在文件写入完成之前打开文件吗？

发布于 2024-11-10 21:42:30 字数 221 浏览 4 评论 0原文

我正在编写一个脚本，该脚本将轮询目录以查找新文件。

在这种情况下，是否有必要进行某种错误检查以确保在访问文件之前已完全写入文件？

我不想在文件完全写入磁盘之前使用它，但因为我想要从文件中获取的信息接近开头，所以似乎可以在不了解文件的情况下提取我需要的数据还没有写完。

这是我应该担心的事情，还是文件会因为操作系统正在写入硬盘而被锁定？

这是在 Linux 系统上。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

残花月 2024-11-17 21:42:31

通常在 Linux 上，除非您使用某种锁定，否则两个进程可以很高兴地同时打开同一个文件，甚至用于写入。可通过三种方法避免出现问题：

锁定
通过让写入者对文件应用锁定，可以防止读取者部分读取文件。然而，大多数锁都是建议性的，因此仍然完全有可能看到部分结果。（强制锁是存在的，但强烈不推荐，因为它们太脆弱了。）编写正确的锁定代码相对困难，将此类任务委托给专业库是很正常的（即数据库引擎！）特别是，您不想在网络文件系统上使用锁定；当它工作时，它会带来巨大的麻烦，并且经常会彻底出错。
约定
可以在同一目录中使用您不会在阅读端自动查找的另一个名称（例如 .foobar.txt.tmp）创建文件，然后自动重命名为写入完成后，输入正确的名称（例如，foobar.txt）。只要您注意处理先前运行无法正确写入文件的可能性，这种方法就可以很好地工作。如果一次只能有一名编写者，那么实现起来相当简单。
不担心
最常见、最频繁写入的文件类型是日志文件。这些可以很容易地以这样的方式编写：信息严格地只附加到文件中，因此任何读者都可以安全地查看文件的开头，而不必担心其脚下的任何变化。这在实践中非常有效。

Python 在这方面并没有什么特别之处。所有在 Linux 上运行的程序都存在相同的问题。

回复收藏 0 原文

走过海棠暮 2024-11-17 21:42:31

在 Unix 上，除非写入应用程序出现问题，否则文件不会被锁定，您将能够从中读取内容。

当然，读者必须准备好处理不完整的文件（请记住，作者一方可能会发生 I/O 缓冲）。

如果这是行不通的，您将不得不考虑一些方案来同步写入器和读取器，例如：

显式锁定文件；
将数据写入临时位置，并且仅在文件完成时将其移动到最终位置（如果源和目标位于同一文件系统上，则移动操作可以原子方式完成）。

回复收藏 0 原文

那小子欠揍 2024-11-17 21:42:31

如果您对写入程序有一定的控制权，请让它将文件写入其他位置（例如 /tmp 目录），然后在完成后将其移动到正在监视的目录。

如果您无法控制进行写入的程序（我所说的“控制”是指“编辑源代码”），您可能也无法使其执行文件锁定，所以这可能是不可能的。在这种情况下，您可能需要了解有关文件格式的信息才能知道编写器何时完成。例如，如果编写者总是将“DONE”写入文件中的最后四个字符，则您可以打开文件，查找到末尾，然后读取最后四个字符。

回复收藏 0 原文