如何使用 MultipleTextOutputFormat 类将默认输出文件重命名为一些有意义的名称?

发布于 2024-12-05 08:53:09 字数 168 浏览 2 评论 0原文

在 Hadoop 的归约阶段之后,我希望输出文件名根据输入键值而有意义。然而,我没有成功地遵循“Hadoop:权威指南”上的示例,该示例使用 MultipleTextOutputFormat 来执行此操作。原因是它基于旧的 API,而在新的 API 上不起作用?

有人可以暗示解决方案或向我指出相关文档吗?

After the reduce phase in Hadoop, I wanted the output file names to be something meaningful depending on the input key value. However I'm not successful on following the example on "Hadoop: The Definative Guide" which used MultipleTextOutputFormat to do this. The reason is that it's based on old API and it doesn't work on the new API ?

Can anybody hint on the solution or point me to the relevant documentation ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

二智少女猫性小仙女 2024-12-12 08:53:09

你可能是对的。大多数在旧 API 中有效的功能在新 API 中并不总是有效。

现在有一种“新方法”可以做到这一点,称为 多重输出

You are probably right. Most things that worked in the old API don't always work in the new one.

There is a "new way" of doing this now, called MultipleOutputs.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文