当前位置：文江博客话题详情

gearman 和重试具有不可靠外部依赖的工人

发布于 2024-12-16 12:23:09 字数 305 浏览 5 评论 0原文

我使用 gearman 对各种不同的作业进行排队，其中一些作业始终可以立即得到服务，而另一些作业可能会“失败”，因为它们需要不可靠的外部服务。（例如，发送电子邮件可能需要经常不可用的 SMTP 服务器。）

如果外部服务出现故障，我希望将需要该服务的所有作业保留在队列中，并偶尔重试一项作业（例如每隔几分钟））直到服务再次可用。（如果服务在几个小时内不可用，也许可以选择发送电子邮件。）

但是，我希望将不需要失败服务的工作尽快转移给工作人员。如何才能实现这一目标？（如果有必要，我很乐意将一些逻辑放入工作人员中，尽管在工作人员方面进行限制似乎有点“晚了”。）

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

黯淡〆 2024-12-23 12:23:09

Gearman 应该已经可以处理这个问题了。只要你有一些工作人员专门处理具有不可靠依赖关系的工作并且不处理其他工作，以及一些工作人员要么完成所有工作，要么只处理没有不可靠依赖关系的工作。

您所需要做的就是向不可靠的依赖工作人员添加一些代码，以便他们只接受一次检查依赖服务是否正在运行的作业，如果服务关闭，那么只需让他们稍等一下并重新测试服务（然后继续无限），一旦服务启动，然后让它们加入 gearmand 服务器，执行工作，返回工作，重新测试服务等。

当依赖服务关闭时，不处理需要该服务的工作的工作人员将保留正在缓慢地经过其他作业的作业队列。如果有可用的工作线程来处理其他作业类型，Gearmand 不会阻止一种作业类型的整个作业队列（或工作线程）。

关键是要明智地定义工作类型和员工。

编辑

- 啊哈，我知道我的想法有点过时，（大约一年前我编写了我的 gearman 系统，从那以后就没有真正接触过它）。我对此类问题的解决方案是，一旦从属服务检测到故障，就让所有通常处理从属作业的工作人员在 gearmand 服务器上注销其从属作业处理能力。（并且当前尝试完成该作业的任何工作人员都应该返回失败。）一旦服务备份 - 让这些工作人员重新注册他们处理该工作的能力。请注意，这确实需要另一个通信渠道来通知工作人员相关服务的状态。

希望这有帮助

回复收藏 0 原文

~没有更多了~