第 8 页 - MapReduce - 文江博客

投稿关注

MapReduce

文章 106 浏览 158

帮助 MongoDB 中的地图缩减

我正在努力牢牢掌握 MapReduce 的工作原理以及何时使用它。我得到了一些没有意义的随机结果，但也许我对 MapReduce 的理解是错误的？这是我正在做的…

旧话新听 2024-11-24 16:32:07 0 0

使用 Mapreduce 进行递归计算

我正在研究地图归约程序，并正在考虑设计以下形式的计算，其中 a1, b1 是与键关联的值， a1/b1, a1+a2/b1+b2, a1+a2+a3/b1+b2+b3 ... 因此在归约器的…

栩栩如生 2024-11-24 04:47:24 1 0

hadoop 中需要迭代的一个很好的例子

我目前正在 hadoop 上实现并行 for，以按照用户指定的次数迭代映射器。有人可以帮助我提供一个有用的示例，我可以使用我的实现进行测试。 Hadoop 中的…

花辞树 2024-11-24 04:43:32 1 0

创建许多实体的 AppEngine 任务

我正在为参加活动的人们构建一个应用程序。我需要为特定事件的人员实体子集创建一个票证实体。实体人数可能超过50,000人。显然，我不能只执行一个 fo…

握住你手 2024-11-24 03:06:03 1 0

用于固定类别查询的 CouchDB

我的 CouchDB 中有这样的文档： { "_id": "0cb35be3cc73d6859c303fa3200011d2", "_rev": "1-f6e356bbf6ab09290aae11132af50d66", "adresse": "Bohrgaß…

往日情怀 2024-11-23 20:38:18 0 0

Disco 的“无法解析工作事件：”是什么意思？错误是什么意思？

我正在尝试使用映射和化简函数来运行 Disco 作业，这些函数在使用 marshal 库通过 TCP 套接字传递后进行反序列化。来解压它们 code = marshal.loads(…

贱贱哒 2024-11-23 19:24:33 0 0

在实践中，您需要多少台机器才能让 Hadoop / MapReduce / Mahout 加速可并行化的计算？

我需要进行一些繁重的机器学习计算。我在局域网上有少量空闲的机器。我需要多少台机器才能使用 hadoop / mapreduce / mahout 分布式计算，以便比在没…

少女情怀诗 2024-11-19 21:36:23 3 0

如何使用 Hive 对大数据进行高效排序（order by）？

我想有效地对大数据集进行排序（即使用自定义分区器，如下所述：MapReduce排序算法是如何工作的？），但我想用hive来实现。然而，Hive手册指出“orde…

无风消散 2024-11-19 21:20:54 1 0

仅在映射器作业上写入值

我目前正在从事 MapReduce 作业，我只使用映射器而不使用减速器。我不需要写出密钥，因为我只需要存储在数组中的值，并希望将其写出作为我的最终输出…

雪化雨蝶 2024-11-19 20:47:12 0 0

如何取 MongoDB 与 CouchDB 中大数据的平均值？

我正在看这个图表... http:// /www.mongodb.org/display/DOCS/MongoDB,+CouchDB,+MySQL+Compare+Grid ...其中表示：查询方法构建索引 CouchDB - Map…

踏月而来 2024-11-19 16:03:16 3 0

MapReduce 还是批处理作业？

我有一个需要在很多文件（1000 个）上调用的函数。每个都是独立的，并且可以并行运行。每个文件的函数输出不需要（当前）与其他文件组合。我有很多服…

兔姬 2024-11-19 14:10:54 4 0

MongoDB/PyMongo：如何在 Map 函数中使用点表示法？

我正在尝试计算每个邮政编码中找到的记录数。在我的 MongoDB 中，嵌入了邮政编码；使用点表示法，它位于 a.res.z（a 代表地址，res 代表住宅，z 代表…

青衫负雪 2024-11-19 04:08:06 2 0

从 MongoDB 中的文本字段生成 Unigram 列表的最有效方法

我需要生成一个一元组向量，即出现在特定文本字段中的所有唯一单词的向量，我将其存储为 MongoDB 中更广泛的 JSON 对象的一部分。我不太确定生成这个…

向地狱狂奔 2024-11-18 21:38:24 3 0

应用程序引擎中止 MapReduce 分片

我启动了一个mapreduce进程，不幸的是它没有中止并且已经耗尽了我所有的CPU。有谁知道有什么方法可以阻止这种情况吗？谢谢，理查德…

寂寞清仓 2024-11-18 11:56:52 3 0

为什么不用 hadoop TeraSort 的映射器/减速器

我计划在 Hadoop 0.20.2 中的 TeraSort 类的映射器中插入一些代码。然而，查看源代码后，我找不到实现mapper的部分。通常，我们会看到一个名为 job.s…

述情 2024-11-18 10:31:45 1 0

共 39 页
上一页
6
7
8
9
10
下一页

已经忘了多久

文章 0 评论 0

关注

15867725375

文章 0 评论 0

关注

LonelySnow

文章 0 评论 0

关注

走过海棠暮

文章 0 评论 0

关注

轻许诺言

文章 0 评论 0

关注

信馬由缰

文章 0 评论 0

友情链接

文江博客

MapReduce

帮助 MongoDB 中的地图缩减

使用 Mapreduce 进行递归计算

hadoop 中需要迭代的一个很好的例子

创建许多实体的 AppEngine 任务

用于固定类别查询的 CouchDB

Disco 的“无法解析工作事件：”是什么意思？错误是什么意思？

在实践中，您需要多少台机器才能让 Hadoop / MapReduce / Mahout 加速可并行化的计算？

如何使用 Hive 对大数据进行高效排序（order by）？

仅在映射器作业上写入值

如何取 MongoDB 与 CouchDB 中大数据的平均值？

MapReduce 还是批处理作业？

MongoDB/PyMongo：如何在 Map 函数中使用点表示法？

从 MongoDB 中的文本字段生成 Unigram 列表的最有效方法

应用程序引擎中止 MapReduce 分片

为什么不用 hadoop TeraSort 的映射器/减速器

热门标签

推荐作者

已经忘了多久

15867725375

LonelySnow

走过海棠暮

轻许诺言

信馬由缰

友情链接