MapReduce

MapReduce

文章 106 浏览 158

帮助 MongoDB 中的地图缩减

我正在努力牢牢掌握 MapReduce 的工作原理以及何时使用它。我得到了一些没有意义的随机结果,但也许我对 MapReduce 的理解是错误的? 这是我正在做的…

旧话新听 2024-11-24 16:32:07 0 0

使用 Mapreduce 进行递归计算

我正在研究地图归约程序,并正在考虑设计以下形式的计算,其中 a1, b1 是与键关联的值, a1/b1, a1+a2/b1+b2, a1+a2+a3/b1+b2+b3 ... 因此在归约器的…

栩栩如生 2024-11-24 04:47:24 1 0

hadoop 中需要迭代的一个很好的例子

我目前正在 hadoop 上实现并行 for,以按照用户指定的次数迭代映射器。有人可以帮助我提供一个有用的示例,我可以使用我的实现进行测试。 Hadoop 中的…

花辞树 2024-11-24 04:43:32 1 0

创建许多实体的 AppEngine 任务

我正在为参加活动的人们构建一个应用程序。我需要为特定事件的人员实体子集创建一个票证实体。实体人数可能超过50,000人。 显然,我不能只执行一个 fo…

握住你手 2024-11-24 03:06:03 1 0

用于固定类别查询的 CouchDB

我的 CouchDB 中有这样的文档: { "_id": "0cb35be3cc73d6859c303fa3200011d2", "_rev": "1-f6e356bbf6ab09290aae11132af50d66", "adresse": "Bohrgaß…

往日情怀 2024-11-23 20:38:18 0 0

Disco 的“无法解析工作事件:”是什么意思?错误是什么意思?

我正在尝试使用映射和化简函数来运行 Disco 作业,这些函数在使用 marshal 库通过 TCP 套接字传递后进行反序列化。 来解压它们 code = marshal.loads(…

贱贱哒 2024-11-23 19:24:33 0 0

在实践中,您需要多少台机器才能让 Hadoop / MapReduce / Mahout 加速可并行化的计算?

我需要进行一些繁重的机器学习计算。我在局域网上有少量空闲的机器。我需要多少台机器才能使用 hadoop / mapreduce / mahout 分布式计算,以便比在没…

少女情怀诗 2024-11-19 21:36:23 3 0

如何使用 Hive 对大数据进行高效排序(order by)?

我想有效地对大数据集进行排序(即使用自定义分区器,如下所述:MapReduce排序算法是如何工作的?),但我想用hive来实现。 然而,Hive手册指出“orde…

无风消散 2024-11-19 21:20:54 1 0

仅在映射器作业上写入值

我目前正在从事 MapReduce 作业,我只使用映射器而不使用减速器。我不需要写出密钥,因为我只需要存储在数组中的值,并希望将其写出作为我的最终输出…

雪化雨蝶 2024-11-19 20:47:12 0 0

如何取 MongoDB 与 CouchDB 中大数据的平均值?

我正在看这个图表... http:// /www.mongodb.org/display/DOCS/MongoDB,+CouchDB,+MySQL+Compare+Grid ...其中表示: 查询方法 构建索引 CouchDB - Map…

踏月而来 2024-11-19 16:03:16 3 0

MapReduce 还是批处理作业?

我有一个需要在很多文件(1000 个)上调用的函数。每个都是独立的,并且可以并行运行。每个文件的函数输出不需要(当前)与其他文件组合。我有很多服…

兔姬 2024-11-19 14:10:54 4 0

MongoDB/PyMongo:如何在 Map 函数中使用点表示法?

我正在尝试计算每个邮政编码中找到的记录数。 在我的 MongoDB 中,嵌入了邮政编码;使用点表示法,它位于 a.res.z(a 代表地址,res 代表住宅,z 代表…

青衫负雪 2024-11-19 04:08:06 2 0

从 MongoDB 中的文本字段生成 Unigram 列表的最有效方法

我需要生成一个一元组向量,即出现在特定文本字段中的所有唯一单词的向量,我将其存储为 MongoDB 中更广泛的 JSON 对象的一部分。 我不太确定生成这个…

向地狱狂奔 2024-11-18 21:38:24 3 0

应用程序引擎中止 MapReduce 分片

我启动了一个mapreduce进程,不幸的是它没有中止并且已经耗尽了我所有的CPU。有谁知道有什么方法可以阻止这种情况吗? 谢谢, 理查德…

寂寞清仓 2024-11-18 11:56:52 3 0

为什么不用 hadoop TeraSort 的映射器/减速器

我计划在 Hadoop 0.20.2 中的 TeraSort 类的映射器中插入一些代码。然而,查看源代码后,我找不到实现mapper的部分。 通常,我们会看到一个名为 job.s…

述情 2024-11-18 10:31:45 1 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文