当前位置：文江博客话题详情

hadoop 日志记录工具？

发布于 2025-01-04 08:00:32 字数 388 浏览 1 评论 0原文

如果我要使用 Zookeeper 作为工作队列并连接到它的各个消费者/工作人员。您会推荐什么作为记录这些工人活动的良好分布式设置？

假设如下：

1) 在任何时候，我们都可以减少到只有一台计算机来容纳 hadoop 集群。系统将根据需要自动缩放，但有大量停机时间，只需要一台计算机。

2）我只需要能够访问所有工作人员日志，而无需访问工作人员所在的单台计算机。请记住，当我阅读这些日志之一时，该机器很可能已终止并早已消失。

3）我们需要轻松访问日志，即能够 cat/grep 和 tail 或者以更 SQLish 的方式 - 我们需要实时查询以及实时监控短时间内的输出时间。（即 tail -f /var/log/mylog.1）

我很欣赏您的专家想法！

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

死开点丶别碍眼 2025-01-11 08:00:32

您是否考虑过使用 Flume、chukwa 或 scribe - 确保您的 Flume 等进程可以访问您尝试聚合到集中式服务器上的日志文件。

水槽参考：
http://archive.cloudera.com/cdh/3/flume/Cookbook/

楚夸：
http://incubator.apache.org/chukwa/docs/r0.4.0 /admin.html

抄写：
https://github.com/facebook/scribe/wiki/_pages

希望有帮助。

回复收藏 0 原文

暮年慕年 2025-01-11 08:00:32

Fluentd 日志收集器刚刚发布了其 WebHDFS 插件，该插件允许用户立即将数据流式传输到 HDFS 中。它确实易于安装且易于管理。

在此处输入图像描述

Fluentd + Hadoop：即时大数据收集

当然，您可以直接从应用程序导入数据。下面是一个针对 Fluentd 发布日志的 Java 示例。 Fluentd 的 Java 库足够聪明，可以在 Fluentd 守护进程关闭时在本地进行缓冲。这减少了数据丢失的可能性。

Fluentd：从 Java 应用程序导入数据

还提供高可用性配置，这基本上使您能够集中式日志聚合系统。

Fluentd：高可用性配置

回复收藏 0 原文

~没有更多了~

关于作者

顾铮苏瑾

暂无简介

文章

26 人气

关注发私信

紫罗兰の梦幻

文章 0 评论 0

关注

-2134

文章 0 评论 0

关注

liuxuanli

文章 0 评论 0

关注

意中人

文章 0 评论 0

关注

○愚か者の日

文章 0 评论 0

关注

xxhui

文章 0 评论 0

友情链接

文江博客

hadoop 日志记录工具？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签