Hadoop:用于可视化键值数据和文件以进行开发的工具

发布于 2024-12-25 08:18:41 字数 382 浏览 2 评论 0原文

是否有任何简单、易于启动的 java 工具用于可视化 MapReduce 作业目录中的键/值数据?

具体来说,我想浏览 20 个作业的 MapReduce 工作流程,单击各个文件并查看数据,甚至可能会看到文件大小的直方图。

  • 这里有一些警告,例如 -

    • 某些文件具有序列化数据(不仅仅是文本)
    • 显然,这个系统在“云规模”上使用可能很愚蠢,而它只是一个开发工具。

尽管如此,这样的工具对于开发和本地调试大型连接的 m/r 管道很有用。

这是出于开发目的(我不想在真实集群中可视化分布式键/值 hadoop 数据) 。

Are there any simple, easily launched java tools for visualizing key/value data from map reduce job directories ?

Specifically i want to browse a 20-job map reduce workflow , cliicking on individual files and looking at the data, and maybe even see a histogram of file sizes.

  • There are some caveats here, for example -

    • Some files have serialized data (not just text)
    • Obviously, this system would probably be silly to use at "cloud scale" , rather its a dev tool.

Nevertheless, such a tool would be useful developing and locally debugging large, connected m/r pipelines.

This is for development purposes (im not trying to visualize the distributed key/value hadoop data in a real cluster).

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

孤者何惧 2025-01-01 08:18:41

查看 KarmaSphere Studio

逐步监控作业执行
- 包含结果的工作流程:显示 MapReduce 作业每一步的结果输出。
- 桌面上的 Hadoop 日志:从桌面轻松访问 Hadoop 日志。
- 作业失败选项:允许指定作业失败选项,例如 EMR 作业失败时自动调用指定脚本。

Checkout the KarmaSphere Studio

Monitor Job Execution Step-by-Step
- Workflow with Results: Shows the resulting output at each step of the MapReduce job.
- Hadoop Logs from the Desktop: Accesses Hadoop logs easily from the desktop.
- Job Failure Options: Allows the specification of job failure options such as automatic invocation of a specified script upon job failure for EMR.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文