经典文件系统问题——目录上的并发远程处理

发布于 2024-07-26 04:30:33 字数 530 浏览 6 评论 0原文

我有一个应用程序，可以处理目录中的文件并将它们与处理后的输出一起移动到另一个目录。没什么特别的。引入了一个有趣的要求：

通过允许多个远程实例在同一文件存储上工作来实现容错和处理吞吐量。

额外的考虑因素是我们不能假设文件系统，因为我们同时支持 Windows 和 NFS。

当然，问题是，如何确保不同的实例不会尝试处理相同的工作，从而可能破坏工作或降低吞吐量？文件锁定可能会出现问题，尤其是跨网络共享时。我们可以使用更复杂的方法，例如简单的数据库或消息传递框架（例如 JMS 或类似的），但整个集群需要具有容错能力。我们不能只有一个数据库或消息传递提供程序，因为它会引入单点故障。

我们已经实现了一个解决方案，该解决方案使用多播消息来自我发现处理实例并选择分配工作的主管。如果主管宕机并进行另一次选举，则会出现超时。然而，我们的网络库还不是很成熟，而且我们的消息实现也很笨拙。

然而，我的直觉告诉我有一种更简单的方法。

想法？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

同展鸳鸯锦 2024-08-02 04:30:33

我认为您可以放心地假设重命名操作在您关心的所有网络文件系统上都是原子的。因此，如果您将大量工作安排为单个文件（或键入单个文件），则让每个服务器首先列出包含新工作的目录，选择一个工作，然后将其重命名为自己的文件服务器名称（例如，计算机名称或 IP 地址）。对于同时执行相同操作的实例之一，重命名将成功，因此它们应该处理该工作。对于其他人来说，它将失败，因此他们应该从获得的列表中选择不同的文件。

对于新工作的创建，假设目录创建 (mkdir) 是原子的，但文件创建不是原子的（对于文件创建，第二个写入者可能会覆盖现有文件）。因此，如果也有多个作品制作者，请为每件作品创建一个新目录。

回复收藏 0 原文

~没有更多了~