当前位置：文江博客话题详情

我们如何一次从文件和 cassandra 执行映射操作？

发布于 2024-10-12 03:43:57 字数 343 浏览 1 评论 0原文

我想通过一次映射来自文件和 cassandra 的输入来完成 hadoop 工作。这可能吗？

我知道从目录获取文件输入文件的方法或从 cassandra 输入数据。

但是，我不确定是否可以从他们那里获取每个输入。

这里有更多提示来描述我的情况。数据格式相同。

像这样的文件：键值1 值2 值3 ...

像这样的 cassandra 列结构：关键栏 |列名1 |列名称 2 |列名 3 关键值|列值1|列 vlaue2 |列值 3 ...

我需要从它们中提取一行，然后根据每个键比较数据。是的，我可以获得重复的密钥或新的密钥或已删除的密钥。

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

城歌 2024-10-19 03:43:57

您可以通过两份工作来完成此任务。首先创建一个仅地图作业，将 Cassandra 数据拉入 HDFS。

然后使用“MultipleInputs”类“addInputPath”指定您想要的数据的两个位置 http://hadoop.apache.org/common/docs/r0.20.1/api/org/apache/hadoop/mapred/lib/MultipleInputs.html

然后在你的地图（你的第二份工作）中，你可以根据你所看到的数据对输入进行基于逻辑的条件性（比如让 cassandra 的第一列说“cassandra”，并在你的地图类中识别出这一点）第二份工作）并在到达减速机时进行清理（使其均匀）。

回复收藏 0 原文

~没有更多了~

关于作者

醉生梦死

暂无简介

0 文章

0 评论

994 人气

关注发私信

留蓝

文章 0 评论 0

关注

18790681156

文章 0 评论 0

关注

zach7772

文章 0 评论 0

关注

Wini

文章 0 评论 0

关注

ayeshaaroy

文章 0 评论 0

关注

初雪

文章 0 评论 0

友情链接

文江博客

我们如何一次从文件和 cassandra 执行映射操作？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

我们如何一次从文件和 cassandra 执行映射操作？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。