谷歌应用程序引擎上的任务队列或多线程

发布于 2024-12-29 23:27:15 字数 163 浏览 2 评论 0原文

我的服务器位于 Google App Engine 上我的工作之一是将大量记录与另一组记录进行匹配。如果我必须将 10000 条记录与 100 条记录匹配，这需要很长时间。实现这个的最好方法是什么。

我使用 Web2py 堆栈并将我的应用程序部署在 Google App Engine 上。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

_畞蕅 2025-01-05 23:27:15

也许我误解了一些东西，但这听起来像是任务队列的完美匹配，而且我看不出多线程有什么帮助，因为我认为这只是说明你可以同时提供许多响应，如果您的回复时间超过了 30 秒的限制。

对于任务，您可以添加它，然后处理直到时间限制，然后如果您在时间限制前尚未完成工作，则使用该任务的其余部分重新创建另一个任务。

回复收藏 0 原文

甜中书 2025-01-05 23:27:15

GAE 不支持多线程代码，因此您不能显式使用它。

GAE 本身可以是多线程的，这意味着一个前端实例可以同时处理多个 http 请求。

在您的情况下，实现并行任务执行的最佳方法是任务队列。

回复收藏 0 原文

长发绾君心 2025-01-05 23:27:15

您正在做的事情的基本结构是让 cron 作业负责将工作划分为更小的单元，并使用任务队列执行每个单元。每个任务的有效负载将是标识第一组中的实体（例如一组密钥）的信息。每个任务将执行将第一组中的实体与第二组中的实体连接所需的任何查询，并存储中间（或可能最终）结果。您可以调整有效负载大小和任务队列速率，直到它按照您想要的方式执行。

如果需要聚合每个任务的结果，您可以让每个任务记录其完成情况并测试所有任务是否已完成，或者仅使用另一个作业来轮询完成记录以触发聚合。当 MapReduce 功能得到更广泛的应用时，这将成为执行此类工作的框架。

http://www.youtube.com/watch?v=EIxelKcyCC0
http://code.google.com/p/appengine-mapreduce/

回复收藏 0 原文

~没有更多了~