当前位置：文江博客话题详情

处理对同一数据集的查询流时的高效 MapReduce

发布于 2024-08-20 10:59:57 字数 301 浏览 4 评论 0原文

我有一个巨大的静态数据集，并且有一个可以应用于它的函数。

f 的形式为 reduce(map(f, dataset))，因此我将使用 MapReduce 骨架。但是，我不想在每个请求中分散数据（理想情况下我想利用索引来加速 f）。有一个 MapReduce 实现可以解决这种一般情况吗？

我查看了 IterativeMapReduce ，也许它可以完成工作，但似乎解决了稍微不同的情况，并且代码尚不可用。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

初心 2024-08-27 10:59:57

Hadoop 的 MapReduce（以及所有其他受 Google 启发的 Map-Reduce 框架）并不总是分散数据。

回复收藏 0 原文

~没有更多了~

关于作者

人间☆小暴躁

暂无简介

0 文章

0 评论

21 人气

关注发私信

花开柳相依

文章 0 评论 0

关注

zyhello

文章 0 评论 0

关注

故友

文章 0 评论 0

关注

对风讲故事

文章 0 评论 0

关注

Oo萌小芽oO

文章 0 评论 0

关注

梦明

文章 0 评论 0

友情链接

文江博客

处理对同一数据集的查询流时的高效 MapReduce

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签