使用 Python、Pika 和 AMQP 设计异步 RPC 应用程序的最佳模式是什么？

发布于 2024-12-04 11:53:13 字数 907 浏览 2 评论 0原文

我的应用程序的生产者模块由想要提交要在小型集群上完成的工作的用户运行。它通过 RabbitMQ 消息代理以 JSON 形式发送订阅。

我尝试了几种策略，到目前为止最好的是以下策略，但仍然无法完全正常工作：

每个集群机器运行一个消费者模块，该模块自行订阅到 AMQP 队列并发出 prefetch_count 告诉代理它可以同时运行多少个任务。

我能够使用 Pika AMQP 库中的 SelectConnection 使其工作。消费者和生产者都启动两个通道，每个通道连接到每个队列。生产者在通道 [A] 上发送请求并在通道 [B] 中等待响应，消费者在通道 [A] 上等待请求并在通道 [B] 上发送响应。然而，当消费者运行计算响应的回调时，它似乎会阻塞，因此我每次只在每个消费者处执行一项任务。

我最终需要的是：

消费者 [A] 向集群订阅他的任务（每次大约 5k），
它可以处理的并发任务数
代理为每个消费者分派 N 个消息/请求，其中 N 是单个任务时完成后，消费者将结果回复给经纪人/生产者，
生产者收到回复，更新计算状态，最后打印一些报告

限制：

如果另一个用户提交工作，则所有他的任务将是在前一个用户之后排队（我猜这在队列系统中是自动成立的，但我没有考虑对线程环境的影响）
任务有提交的顺序，但它们回复的顺序并不重要

更新

我进一步研究了一些，我的实际问题似乎是我使用一个简单的函数作为 pika 的 SelectConnection.channel.basic_consume() 函数的回调。我的最后一个（未实现的）想法是传递一个线程函数，而不是常规函数，这样回调就不会阻塞并且消费者可以继续监听。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

善良天后 2024-12-11 11:53:13

正如您所注意到的，您的进程在运行回调时会阻塞。有多种方法可以处理此问题，具体取决于您的回调的作用。

如果您的回调是 IO 绑定的（执行大量网络或磁盘 IO），您可以使用线程或基于 greenlet 的解决方案，例如 gevent、eventlet 或温室。但请记住，Python 受到 GIL（全局解释器锁）的限制，这意味着单个 Python 进程中只能运行一段 Python 代码。这意味着，如果您使用 python 代码进行大量计算，这些解决方案可能不会比您已有的解决方案快很多。

另一种选择是使用 multiprocessing。我发现多处理在进行并行工作时非常有用。您可以通过使用 Queue，让父进程作为消费者并将工作外包给其子进程，或者简单地启动多个进程，每个进程都自己消耗。我建议，除非您的应用程序是高度并发的（数千个工作线程），否则只需启动多个工作线程，每个工作线程都从自己的连接中消耗数据。这样，您可以使用 AMQP 的确认功能，因此如果消费者在仍在处理任务时死亡，消息会自动发送回队列并由另一个工作线程拾取，而不是简单地丢失请求。

最后一个选择，如果您控制生产者并且它也是用 Python 编写的，那就是使用像 celery 为您抽象任务/队列的工作方式。我已经在几个大型项目中使用了 celery，并且发现它写得非常好。它还将通过适当的配置为您处理多个消费者问题。