为 MongoDB 调度 MapReduce 作业

发布于 2024-11-14 16:53:56 字数 182 浏览 0 评论 0原文

这更多的是一个实现问题，但是使用 cron 这样简单的东西来调度 MongoDB 的 mapreduce 这样的任务有什么缺点吗？说需要每小时执行一次，这似乎是一个合适的方法......但我想我只是问因为所有流行的作业排队系统，如 Resque 和其他系统。

我想我的问题更像是， cron 是否提供了足够可靠和可靠的解决方案？想法？

需要登录才能够评论，你可以免费注册一个本站的账号。

离笑几人歌 2024-11-21 16:53:56

Cron 已经使用了几十年，相当可靠和稳定；如果您的 cron 不可靠，那么我建议您与操作系统供应商进行严肃的讨论。此外，MongoDB 文档讨论了 cron 作业（例如 google“site:mongodb.org cron”），因此，大概 MongoDB 会出现 cron 作业。

也就是说，如果您已经为另一个调度系统设置了一堆基础设施，那么可能没有理由将 cron 用于 MongoDB 并使用其他东西来执行其他任务。

无论如何，如果您的 cron 作业可能需要足够长的时间才能重叠，并且您一次只希望运行一个，您可能需要分层使用简单的 PID 文件锁定系统：

cron 作业在启动时查找 PID 文件。
如果找到该文件，则会从该文件中读取旧作业的 PID 并检查它是否仍在运行。
- 如果旧的正在运行，那么新的会抱怨并退出。
- 如果旧的没有运行，那么新的将继续运行。
当新作业确定可以启动时，它将其 PID 写入 PID 文件。
当新作业完成时，它会在退出之前立即删除 PID 文件（或使用 atexit 处理程序或您的环境支持的任何类似功能）。