使用 Java 类作为映射器，使用 Python 脚本作为减速器

发布于 2025-01-04 19:22:17 字数 415 浏览 1 评论 0原文

我正在尝试使用流式传输来运行hadoop。我有两个文件。一个是mapper的java文件，另一个是reducer的python脚本。

MerkleMapper.java

MerkleMapper 类扩展了 MapREduceBase 并定义了 map() 函数。对于输入拆分的每个记录，它读取传入的 key(byte_offset) 、 value(line) 对，并输出 byte_offset 和哈希值线。

Reducer 是一个 python 脚本，它组合了所有哈希值并生成顶部哈希值。

是否可以将两者（java 和 python）结合起来。我如何使用 Streaming 将我的 java 文件指定为映射器。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

伏妖词 2025-01-11 19:22:17

你可以把它分成两份工作。

第一个作业只有一个映射器（您的 Java 映射器），您获取其输出并将其传递到 python 流作业中，其中您的 Mapper 是身份映射器，您的减速器是 python Reducer。目前，据我所知，你不能将流媒体和java结合起来。

回复收藏 0 原文

~没有更多了~

关于作者

∝单色的世界

暂无简介

文章

26 人气

关注发私信

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

使用 Java 类作为映射器，使用 Python 脚本作为减速器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

使用 Java 类作为映射器，使用 Python 脚本作为减速器

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。