当前位置：文江博客话题详情

Ruby HBase HDFS logging splunk

用于构建分布式日志聚合器（如 Splunk）的最佳组件堆栈是什么？

发布于 2024-09-06 14:58:29 字数 927 浏览 8 评论 0原文

我正在尝试找到可以用来构建类似于 Splunk 的最佳组件，以便聚合计算网格中大量服务器的日志。此外，它应该是分布式的，因为我每天都有大量的日志，并且没有一台机器能够存储日志。

我对能够与 Ruby 一起工作并且能够在 Windows 和最新的 Solaris 上工作的东西特别感兴趣（是的，我有一个动物园）。

我将架构视为：

日志爬虫（Ruby 脚本）。
分布式日志存储。
分布式搜索引擎。
轻量化前端。

日志爬虫和分布式搜索引擎是不可能的——日志将由Ruby脚本解析，ElasticSearch将用于索引日志消息。前端也很容易选择——Sinatra。

我的主要问题是分布式日志存储。我研究了 MongoDB、CouchDB、HDFS、Cassandra 和 HBase。

MongoDB 被拒绝，因为它无法在 Solaris 上运行。
CouchDB 不支持分片（需要 smartproxy 才能使其工作，但这是我不想尝试的事情）。
Cassandra 运行良好，但它只是占用磁盘空间，并且需要每天运行自动平衡以在 Cassandra 节点之间分散负载。
HDFS 看起来很有前途，但 FileSystem API 仅限于 Java，而 JRuby 则很痛苦。
HBase 看起来是一个最好的解决方案，但部署它和监控只是一场灾难 - 为了启动 HBase，我需要首先启动 HDFS，检查它是否启动没有问题，然后启动 HBase 并检查它，然后启动 REST 服务和也检查一下。

所以我被困住了。有人告诉我 HDFS 或 HBase 是用作日志存储的最佳选择，但 HDFS 只能与 Java 顺利配合，而 HBase 只是部署/监控的噩梦。

任何人都可以分享使用我上面描述的组件或完全不同的东西构建类似系统的想法或经验吗？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

黯然#的苍凉 2024-09-13 14:58:29

我建议使用 Flume 将数据聚合到 HBase。您还可以使用 Flume 的 Elastic Search Sink 来保持搜索索引最新即时的。

有关更多信息，请参阅我对Quora 上有类似的问题。

回复收藏 0 原文

最舍不得你 2024-09-13 14:58:29

关于 Java 和 HDFS - 使用 BeanShell 等工具，您可以通过 Javascript 与 HDFS 存储进行交互。

回复收藏 0 原文

~没有更多了~

关于作者

滥情稳全场

暂无简介

0 文章

0 评论

24 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

Gabu-gabumon

文章 0 评论 0

qq_CgiN62

文章 0 评论 0

荔枝明

文章 0 评论 0

赏烟花じ飞满天

文章 0 评论 0

独守阴晴ぅ圆缺

文章 0 评论 0

¤→小豸慧

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文