当前位置：文江博客话题详情

管道化 hadoop map reduce 作业

发布于 2024-09-27 17:29:27 字数 111 浏览 3 评论 0 原文

我有五个地图缩减，每个地图都单独运行。我想将它们全部放在一起。因此，一项工作的输出将转到下一项工作。目前，我编写了 shell 脚本来执行它们。有没有办法用java来写这个？请举个例子。

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

冰葑 2024-10-04 17:29:27

您可能会发现 JobControl 是最简单的链接方法这些工作放在一起。对于更复杂的工作流程，我建议查看 Oozie。

回复收藏 0 原文

￡噩梦荏苒 2024-10-04 17:29:27

你好
我有类似的要求
执行此操作的一种方法是

在提交第一个作业后执行以下操作

Job job1 = new Job( getConf() );
job.waitForCompletion( true );

，然后使用检查状态

if(job.isSuccessful()){
    //start another job with different Mapper.
    //change config
    Job job2 = new Job( getConf() );
}

Hi
I had similar requirement
One way to do this is

after submitting first job execute following

Job job1 = new Job( getConf() );
job.waitForCompletion( true );

and then check for status using

if(job.isSuccessful()){
    //start another job with different Mapper.
    //change config
    Job job2 = new Job( getConf() );
}

回复收藏 0 原文

爱的那么颓废 2024-10-04 17:29:27

Oozie 是适合您的解决方案。您可以通过 Oozie 的操作标签提交 map-reduce 类型的作业、hive 作业、pig 作业、系统命令等。

它甚至有一个协调员，充当您工作流程的 cron。

回复收藏 0 原文

鲸落 2024-10-04 17:29:27

另一种可能性是 Cascading，它还在 Hadoop 之上提供了一个抽象层：它似乎提供了类似的工作组合- 与 Hadoop 概念密切相关，但让 hadoop 完成使用调用 Pig 脚本的 Oozie 工作流程所获得的 M/R 繁重工作。

回复收藏 0 原文

桃扇骨 2024-10-04 17:29:27

对于你的用例，我认为 Oozie 会很好。 Oozie 是一个工作流调度程序，您可以在其中编写不同的操作（可以是 map-reduce、java、shell 等）来执行一些计算、转换、丰富等。对于本例：

操作 A : i/p 输入 o/pa

动作B：i/pao/pb

动作C：i/pbo/pc（最终输出）

您最终可以将c持久化到HDFS中，并可以决定持久化或删除中间输出。

如果您想在单个操作中完成所有三个操作完成的计算，那么您可以使用级联。您可以通过他们的官方文档更好地了解 Cascading，也可以参考我的博客：https://tech.flipkart.com/expressing-etl-workflows-via-cascading-192eb5e7d85d

回复收藏 0 原文

~没有更多了~

关于作者

黒涩兲箜

暂无简介

0 文章

0 评论

21 人气

关注发私信

qq_FjTq5B

文章 0 评论 0

关注

18273202778

文章 0 评论 0

关注

WordPress小学生

文章 0 评论 0

关注

〃温暖了心ぐ

文章 0 评论 0

关注

迷乱花海

文章 0 评论 0

关注

niuniu

文章 0 评论 0

友情链接

文江博客

管道化 hadoop map reduce 作业

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

管道化 hadoop map reduce 作业

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。