当前位置：文江博客话题详情

直接从 EMR Map/Reduce 任务访问 S3

发布于 2025-01-05 01:52:49 字数 98 浏览 1 评论 0原文

我试图弄清楚如何直接从 EMR 映射任务写入 s3 存储桶。我想运行一个 python 流作业，它会从互联网获取一些数据并将其保存到 s3 - 而不将其返回以减少作业。有人能帮我吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

誰ツ都不明白 2025-01-12 01:52:49

为什么不将 MR 作业的输出设置为 s3 目录并告诉它没有减速器：

./elastic-mapreduce ..... --output s3n://bucket/outputfiles --reducer NONE

这应该可以完成您想要的操作。

然后你的脚本可以做这样的事情（对不起，ruby）：

STDIN.each do |url|
  puts extract_data(url)
end

Why don't you just set the output of your MR job to be a s3 directory and tell it that there is no reducer:

./elastic-mapreduce ..... --output s3n://bucket/outputfiles --reducer NONE

That should do what you want it to.

Then your script can do something like this (sorry, ruby):

STDIN.each do |url|
  puts extract_data(url)
end

回复收藏 0 原文

~没有更多了~

关于作者

电影里的梦

暂无简介

文章

25 人气

关注发私信

卷耳

文章 0 评论 0

关注

佚名

文章 0 评论 0

关注

℉服软

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

凉宸

文章 0 评论 0

关注

gyhjy

文章 0 评论 0

友情链接

文江博客

直接从 EMR Map/Reduce 任务访问 S3

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

直接从 EMR Map/Reduce 任务访问 S3

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

卷耳

佚名

℉服软

qq_2gSKZM

凉宸

gyhjy

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。