使用 PHP 进行异步处理 - 每个作业一名工人

发布于 2024-09-14 20:54:03 字数 519 浏览 15 评论 0原文

考虑一个 PHP Web 应用程序，其目的是接受用户请求来启动通用异步作业，然后创建一个工作进程/线程来运行该作业。这些作业并不是特别密集的 CPU 或内存，但预计会经常阻塞 I/O 调用。每秒启动的作业不应超过一或两个，但由于运行时间较长，可能会同时运行许多作业。

因此，并行运行这些作业至关重要。此外，每个作业都必须由负责杀死挂起的工作程序、根据用户请求中止工作程序等的管理器守护程序进行监控。

实现这样的系统的最佳方法是什么？我可以看到：

从经理那里分叉一个工人——这似乎是最低级别的选择，我必须自己实现一个监控系统。 Apache 是 Web 服务器，因此该选项似乎需要通过 FastCGI 启动任何 PHP 工作线程。
使用某种作业/消息队列。（gearman、beanstalkd、RabbitMQ 等） - 最初，这似乎是显而易见的选择。经过一番研究后，我对所有选项都有些困惑。例如，Gearman 看起来像是为大型分布式系统设计的，其中有固定的工作人员池……所以我不知道它是否适合我的需要（每个工作一个工作人员）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

握住我的手 2024-09-21 20:54:03

好吧，如果您使用的是 Linux，则可以使用 pcntl_fork 来分叉子项。然后“主人”看着孩子们。每个孩子都完成了自己的任务，然后正常存在。

就我个人而言，在我的实现中我从来不需要消息队列。我只是在“master”中使用了带有锁的数组。当一个孩子找到工作时，它会写一个带有工作 ID 号的锁定文件。然后主人就会等到那个孩子出去。如果孩子退出后锁定文件仍然存在，那么我知道任务尚未完成，并使用相同的作业重新启动孩子（删除锁定文件后）。根据您的情况，您可以在简单的数据库表中实现队列。在表中插入作业，并每 30 或 60 秒检查主表中的新作业。然后，只有在子进程完成后才将它们从表中删除（并且子进程删除了锁定文件）。如果你同时运行多个“master”，这就会出现问题，但你可以实现一个全局“master pid 文件”来检测和防止多个实例......

而且我不建议使用 FastCGI 进行分叉。它可能会导致一些非常模糊的问题，因为环境应该持续存在。相反，如果您必须拥有 Web 界面，请使用 CGI，但最好使用 CLI 应用程序（守护程序）。要与其他进程的主进程进行交互，您可以使用套接字进行 TCP 通信，或者创建一个用于通信的 FIFO 文件。

至于检测挂起的工作线程，您可以实现一个“心跳”系统，其中子进程每隔几秒向主进程发出一个 SIG_USR1 。那么如果那段时间你有两三次没有收到孩子的消息，它可能就被挂了。但问题是，由于 PHP 不是多线程的，因此您无法判断子进程是否挂起，或者它是否只是在等待阻塞资源（例如数据库调用）...至于实现“心跳” ，您可以使用 tick 函数来自动化心跳（但请记住，阻塞调用仍然不会执行）...