第 9 页 - MapReduce - 文江博客

投稿关注

MapReduce

文章 106 浏览 158

使用 MapReduce 进行排列

有没有办法用 MapReduce 生成排列？输入文件： 1 title1 2 title2 3 title3 我的目标： 1,2 title1,title2 1,3 title1,title3 2,3 title2,title3 …

待天淡蓝洁白时 2024-11-18 09:50:47 3 0

Apache PIG 问题

我对运行 Pig 脚本/ Map-Reduce 作业有几个问题。我知道pig在真正开始执行map/reduce作业之前会创建逻辑计划、物理计划以及执行计划；我可以使用命令…

离笑几人歌 2024-11-18 05:15:21 2 0

地图减少按日期和类别划分的标签计数

我仍在尝试将我的大脑集中在地图缩减上。我有一组文章，每篇文章都属于一个类别，每篇文章都有一组关键字。假设该文档如下所示： { author: "kris", c…

×纯※雪 2024-11-17 23:05:02 0 0

具有已排序文件的 Hadoop MapReduce

我正在使用 Hadoop MapReduce。我已经在 HDFS 中获取了数据，并且每个文件中的数据都已排序。是否可以强制 MapReduce 在映射阶段后不使用数据？我尝试…

笔芯 2024-11-17 13:56:39 0 0

Hadoop 减少任务挂起

我设置了一个具有4个节点的hadoop集群，当运行map-reduce任务时，map任务很快完成，而reduce任务挂在27%。我检查了日志，是reduce任务无法从map节点获…

寂寞清仓 2024-11-17 05:59:01 4 0

如何从 SQL 转换为 NoSQL/MapReduce？

我有使用关系数据库的背景，但最近开始涉足 CouchDB，并对一些非关系操作（在 SQL 中很简单）在 CouchDB 中并不是一流函数感到惊讶。如果您花点时间…

黯然#的苍凉 2024-11-17 04:38:16 1 0

CouchDB 的特殊 Map/Reduce 结果

我已经使用 CouchDB 一段时间了，没有任何问题。到目前为止就是这样。我最近在我的地图/减少结果中看到了一些我忽略的东西！这是在对“avgs”变量执…

你是我的挚爱i 2024-11-17 04:13:06 0 0

Hive (Hadoop) 中的 COLLECT_SET()

我刚刚了解了 Hive 中的collect_set() 函数，并开始了开发 3 节点集群的工作。我只有大约 10 GB 需要处理。然而，这项工作确实需要很长时间。我认为c…

许仙没带伞 2024-11-17 01:31:40 1 0

Hadoop 映射器发出一个唯一的密钥。我可以在每个地图之后执行减速器吗？

我的映射器发出 “uniq key”-“非常大的值”对。我的减速器不知道密钥是唯一的。因此，reducer 会等待所有映射器完成。我尝试使用组合器，但这对…

时光沙漏 2024-11-17 01:10:26 2 0

可以使用 MapReduce 和 Hadoop 并行处理批处理作业吗？

我们的组织有数百个夜间运行的批处理作业。其中许多工作需要 2、3、4 小时才能完成；有的甚至需要长达7个小时。目前，这些作业以单线程模式运行，因此…

一抹淡然 2024-11-16 19:14:17 1 0

获取 MongoDB 中特定字段平均值的最快方法

假设我有一个如下所示的数据集： { "_id" : ObjectId("4dd51c0a3f42cc01ab0e6506"), "views" : 1000, "status" : 1 } { "_id" : ObjectId("4dd51c0e3f…

与他有关 2024-11-16 10:30:35 2 0

mongodb - 检索数组子集

看似简单的任务对我来说是一个挑战。我有以下 mongodb 结构： { (...) "services": { "TCP80": { "data": [{ "status": 1, "delay": 3.87, "ts": 130…

浅紫色的梦幻 2024-11-16 07:51:26 5 0

有没有更好的方法将 mongodb 查询导出到新集合？

我想要什么：我有一个产品主集合，然后我想过滤它们并将它们放入一个单独的集合中。 db.masterproducts.find({category:"潜水装备"}).copyTo(db.newc…

澜川若宁 2024-11-16 06:09:12 1 0

递归函数的网络模拟是什么？

这是 Wolfram 科学会议上提出的一个雄心勃勃的问题：是否存在递归函数的网络模拟之类的东西？也许是一种迭代的“地图缩减”模式？如果我们在迭代中添…

So尛奶瓶 2024-11-16 02:51:31 3 0

CouchDB“加入”两个文件

我有两个看起来有点像这样的文档： Doc { _id: AAA, creator_id: ..., data: ... } DataKey { _id: ..., credits_left: 500, times_used: 0, data_id:…

唐婉 2024-11-16 00:05:27 0 0

共 39 页
上一页
7
8
9
10
11
下一页

友情链接

文江博客

MapReduce

使用 MapReduce 进行排列

Apache PIG 问题

地图减少按日期和类别划分的标签计数

具有已排序文件的 Hadoop MapReduce

Hadoop 减少任务挂起

如何从 SQL 转换为 NoSQL/MapReduce？

CouchDB 的特殊 Map/Reduce 结果

Hive (Hadoop) 中的 COLLECT_SET()

Hadoop 映射器发出一个唯一的密钥。我可以在每个地图之后执行减速器吗？

可以使用 MapReduce 和 Hadoop 并行处理批处理作业吗？

获取 MongoDB 中特定字段平均值的最快方法

mongodb - 检索数组子集

有没有更好的方法将 mongodb 查询导出到新集合？

递归函数的网络模拟是什么？

CouchDB“加入”两个文件

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接