当前位置：文江博客话题详情

用于检测陈旧数据的可扩展算法

发布于 2024-11-29 12:32:47 字数 214 浏览 6 评论 0原文

问题是：

安装在许多不同服务器上的“代理”每 5 秒向中央服务器发送一次“心跳”信号。如何主动找到心跳超过10秒的人并发出警报？

如果不考虑可扩展性，问题很简单。最简单的形式是，您可以在数据库表中记录从每个代理收到的最新心跳的时间戳，并运行常规查询以查找早于阈值的心跳。

然而，该解决方案无法扩展到数百万个代理。

我正在寻找使这成为可能的算法或技术。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

幻梦 2024-12-06 12:32:47

使用地图：AgentId --> LastHearbeatTime
使用 11 组（假设 1 秒的分辨率就足够了），每组保存 1 秒窗口中报告的 Agent 的 ID。

每次代理报告心跳时：
1.在地图上找到它
2.从相关集合中删除
3.在地图中更新
4.将其添加到相关集合中

定义一个线程：每秒一次，最旧的集合过期。它应该是空的。如果没有 - 它包含未报告的代理的 ID。一旦集合过期，您可以重复使用它（集合的循环数组）。

我相信它可以在没有锁的情况下实现（也许你需要12套）。

回复收藏 0 原文

最冷一天 2024-12-06 12:32:47

如果不了解语言和平台，就很难为您提供详细的实施建议，但我的建议与 Lior Kogan 的建议有些相似。
然而，在我看来，你只需要两个集合，并且不涉及映射：

假设你有两个代表集合的变量，A和B。

每次心跳都会从集合A中删除代理ID。
每 5 秒，一个不同的线程会针对 B 中的每个代理 id 发出警报，然后设置 B = A，最后但并非最不重要的一点是创建一个包含所有代理 id 的集合，并将 A 设置为等于该值（如果代理 id 的数量真的很大，你可以在一张支票和另一张支票之间准备新的一套，然后只在剩下的时间里睡觉）。
如果您使用无锁集合集合，则仅在更改指向每个集合的变量时才需要锁定。
性能在很大程度上取决于所述实现的算法复杂性，如果你按照这种方式进行，你应该优先考虑性能最好的算法（不一定是最好的大O，例如，如果最坏情况下的延迟对你很重要）。

附带说明一下，如果内存不是问题或者故障相对较少，那么当您检查是否需要发出警报并执行此操作时，您可以在其自己的线程上执行此操作，并获得可能有趣的性能加速（同样，平台和运行时很重要，因为在 erlang 中这很容易，但在 Windows 中，创建一个成熟的新线程的成本可能会超过性能收益（如果故障很少），而代价是将旧的 B 集保留在内存中。

回复收藏 0 原文

等风来 2024-12-06 12:32:47

MongoDB 非常适合这种类型的使用。虽然不完全是一种算法，但它确实符合创建此服务所需的基础技术的要求。我们在 CopperEgg 中将其用于我们的 RevealCloud 产品，以完全按照您所说的操作 - 我们发送当系统离开一段时间时发出警报 - 每 5 秒采样一次。我很想了解更多有关您的想法和用例的信息。你能提供更多细节吗？

回复收藏 0 原文

~没有更多了~