Flume 自动扩展和故障转移

发布于 2024-12-20 04:54:08 字数 542 浏览 3 评论 0原文

我的公司正在考虑使用 Flume 进行一些相当大容量的日志处理。我们认为，出于容量（可扩展性）和故障转移（可靠性）的原因，日志处理需要分布式，而 Flume 似乎是显而易见的选择。

然而，我们认为我们一定错过了一些明显的东西，因为我们没有看到 Flume 如何提供自动可扩展性和故障转移。

我想定义一个流程，对每个日志行执行 A 件事，然后传递它并执行 B 件事，然后传递它并执行 C 件事，依此类推，这似乎与 Flume 非常匹配。然而，我希望能够用纯粹的逻辑术语来定义这个流，然后基本上说，“嘿 Flume，这里是服务器，这里是流定义，开始工作吧！”。服务器将会死亡（并且操作将重新启动它们），我们将向集群添加服务器，并淘汰其他服务器，而 Flume 只会将工作定向到具有可用容量的任何节点。

这个描述是 Hadoop Map-Reduce 如何实现可扩展性和故障转移的，我假设 Flume 也是一样的。但是，文档似乎暗示我需要手动配置每个逻辑节点在哪些物理服务器上运行，并为每个节点配置特定的故障转移场景。

我是对的吗？Flume 不符合我们的目的，还是我错过了什么？

感谢您的帮助。

原文

分享到QQ

分享到微博