访问 MapReduce 配置/统计信息以进行日志记录和分析

发布于 2024-12-26 02:04:56 字数 189 浏览 0 评论 0原文

我们正在努力从地图缩减作业中收集统计数据。我们将使用计数器来处理某些事情,但我想知道是否有某种方法可以访问 Web UI 上的统计信息,例如插入的行、读/写的字节等,以便我们可以将它们推送到数据库中以便以后检查。

Web UI 如何收集所有这些数据,我们是否可以以不涉及解析下载的报告 html 视图的方式使用这些收集的数据?比如作业输出的文件?

We're working on gathering statistics from our map reduce jobs. We're going to use counters for some things but I wonder if there's some way to access the statistics on the Web UI, such as rows inserted, bytes read/written, etc, in such a way that we can shove them into a database for later inspection.

How does the Web UI gather all this data, and can we use this gathered data in a way that doesn't involve parsing a downloaded html view of the report? Such as a file outputted by the job?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

來不及說愛妳 2025-01-02 02:04:56

这是访问作业的教程柜台。以下是获取给定 jobid 的计数器的代码。

JobId jobId = new JobId("12345", 0);
集群 cluster = new Cluster(new Configuration());

作业 job = cluster.getJob(jobId);
计数器 counters = job.getCounters();

计数器 counter = counters.findCounter(JobCounter.NUM_FAILED_REDUCES);
long failedTasks = counter.getValue();

检索到计数器后,将它们放入数据库中并在 UI 中显示它们。

除了用户定义的计数器JobCounterTaskCounter 是一些 Hadoop 定义的计数器。

Here is the tutorial for accessing the job counters. Here is the code to fetch the counters given jobid.

JobId jobId = new JobId("12345", 0);
Cluster cluster = new Cluster(new Configuration());

Job job = cluster.getJob(jobId);
Counters counters = job.getCounters();

Counter counter = counters.findCounter(JobCounter.NUM_FAILED_REDUCES);
long failedTasks = counter.getValue();

Once the counters have been retrieved put them in a DB and display them in the UI.

Besides the user defined counters JobCounter and TaskCounter are some of the Hadoop defined counters.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文