Celery 在本地系统上是否与 python 多处理一样高效？

发布于 2025-01-04 08:04:50 字数 409 浏览 2 评论 0原文

我在决定为我的应用程序使用 python 多重处理、celery 或 pp 时遇到了一些麻烦。

我的应用程序占用大量 CPU，但目前仅使用一个 cpu，因此，我需要将其分布在所有可用的 cpu 上（这导致我查看了 python 的多处理库），但我读到，如果需要，该库无法扩展到其他计算机。现在我不确定是否需要多个服务器来运行我的代码，但我正在考虑在本地运行 celery，然后扩展只需要添加新服务器而不是重构代码（就像我使用的那样）多处理）。

我的问题是：这个逻辑正确吗？在本地使用 celery 是否有任何负面（性能）（如果事实证明具有多个核心的单个服务器可以完成我的任务）？还是更建议使用多处理并稍后将其发展为其他东西？

谢谢！

PS这是一个个人学习项目，但也许有一天我会想在一家公司担任开发人员，并想了解专业人士是如何做到这一点的。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

星軌x 2025-01-11 08:04:51

我刚刚完成了一个测试，以确定 celery 在 multiprocessing.Pool 和共享数组上增加了多少开销。该测试在 (292, 353, 1652) uint16 数组上运行维纳滤波器。两个版本都使用相同的分块（粗略地：将 292,353 个维度除以可用 cpu 数量的平方根）。尝试了两个 celery 版本：一种解决方案发送腌制数据，另一种解决方案在每个工作人员中打开底层数据文件。

结果：在我的 16 核 i7 CPU 上，celery 大约需要 16 秒，带有共享数组的 multiprocessing.Pool 大约需要 15 秒。我发现这种差异出奇地小。

增加粒度会明显增加差异（celery 必须传递更多消息）：celery 需要 15 秒，multiprocessing.Pool 需要 12 秒。

考虑到芹菜工作人员已经在主机上运行，而池工作人员在每次运行时都会分叉。我不确定如何从一开始就启动多处理池，因为我在初始化程序中传递了共享数组：

with closing(Pool(processes=mp.cpu_count(), initializer=poolinit_gen, initargs=(sourcearrays, resarrays))) as p:

并且只有重新数组受锁定保护。

I just finished a test to decide how much celery adds as overhead over multiprocessing.Pool and shared arrays. The test runs the wiener filter on a (292, 353, 1652) uint16 array. Both versions use the same chunking (roughly:divide the 292,353 dimensions by the square root of the number of available cpu's). Two celery versions were tried: one solution sends pickled data the other opens the underlying data file in every worker.

Result: on my 16 core i7 CPU celery takes about 16s, multiprocessing.Pool with shared arrays about 15s. I find this difference surprisingly small.

Increasing granularity increases the difference obviously (celery has to pass more messages): celery takes 15 s, multiprocessing.Pool takes 12s.

Take into account that celery workers were already running on the host whereas the pool workers are forked at each run. I am not sure how could I start multiprocessing pool at the beginning since I pass the shared arrays in the initializer:

with closing(Pool(processes=mp.cpu_count(), initializer=poolinit_gen, initargs=(sourcearrays, resarrays))) as p:

and only the resarrays are protected by locking.

回复收藏 0 原文

漆黑的白昼 2025-01-11 08:04:51

我实际上从未使用过 Celery，但我使用过多重处理。

Celery 似乎有几种传递消息（任务）的方法，包括您应该能够在不同机器上运行工作程序的方法。因此，缺点可能是消息传递可能比多处理慢，但另一方面，您可以将负载分散到其他机器上。

你是对的，多处理只能在一台机器上运行。但另一方面，进程之间的通信可以非常快，例如通过使用共享内存。此外，如果您需要处理大量数据，您可以轻松地从本地磁盘读取数据并将数据写入本地磁盘，只需在进程之间传递文件名即可。

我不知道 Celery 处理任务失败的情况如何。例如，任务可能永远不会完成运行，或者可能崩溃，或者您可能希望能够在任务未在特定时间限制内完成时终止该任务。我不知道如果不存在的话添加对此的支持会有多困难。

多处理并不具有开箱即用的容错能力，但您可以自己构建它，而不会有太多麻烦。

回复收藏 0 原文

~没有更多了~

关于作者

一口甜

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

Celery 在本地系统上是否与 python 多处理一样高效？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

Celery 在本地系统上是否与 python 多处理一样高效？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。