在用户等待时处理大量数据的最佳实践（在 Rails 中）？

发布于 2024-10-02 01:43:32 字数 798 浏览 14 评论 0原文

我有一个小书签，使用时会将当前浏览器页面上的所有 URL 提交到 Rails 3 应用程序进行处理。在幕后，我使用 Typhoeus 来检查每个 URL 是否返回 2XX 状态代码。目前，我通过向 Rails 服务器发出 AJAX 请求来启动此过程，然后只需等待它处理并返回结果。对于较小的集合来说，这非常快，但是当 URL 的数量相当大时，用户可能会等待长达 10-15 秒。

我考虑过使用延迟作业在用户线程之外处理此问题，但这似乎不是正确的用例。由于用户需要等到处理完成才能看到结果，并且延迟作业可能需要长达五秒的时间才能开始作业，因此我无法保证处理会尽快发生。不幸的是，在这种情况下，这个等待时间是不可接受的。

理想情况下，我认为应该发生的是这样的：

用户点击小书签
数据被发送到服务器进行处理
等待页面立即返回，同时分出一个线程来进行处理
等待页面通过 ajax 定期轮询处理结果，更新等待页面（例如：“已处理 567 个 URL 中的 4 个...”）
一旦结果准备好，等待页面就会更新结果

一些额外的细节：

我正在使用 Heroku（长时间运行的进程在 30 秒后被终止
）登录和匿名用户可以使用此功能

这是执行此操作的典型方法，还是有更好的方法？我应该滚动自己的线程外处理来在处理期间更新数据库，还是有类似延迟作业的东西可以用于此目的（并且适用于 Heroku）？任何朝正确方向的推动将不胜感激。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

來不及說愛妳 2024-10-09 01:43:32

我认为你的后一个想法最有道理。我只是将每个 url 检查的处理卸载到其自己的线程（因此所有 url 检查同时运行——无论如何，这应该比顺序检查快得多）。当每个线程完成时，它都会更新数据库（确保线程不会干扰彼此的写入）。 AJAX 端点（正如您所说，您在客户端定期轮询）将从数据库获取并返回已完成进程的计数。这是一个足够简单的方法，我真的认为不需要任何额外的组件。

回复收藏 0 原文

~没有更多了~