MapReduce

MapReduce

文章 106 浏览 160

如何在 SQL 中跨对象/数组映射函数?

假设表中有一些数据,其中包含每天进入商店的顾客的姓名和年龄(id 用作唯一的日期标识符)。 id, obj --------------------------------------------…

耳钉梦 2025-01-11 16:21:30 0 0

Hadoop 流中的退出代码 141

在 Hadoop 流作业中遇到退出代码 141。 在Google搜索后,我发现141错误是关于管道损坏的... 我的工作是从json生成protobuf实例。 当我仔细查看错误日…

时间海 2025-01-11 10:53:18 1 0

累积数万亿个值的分组总和

我有一个数据缩减问题,事实证明该问题很难解决。 本质上,我有一个程序,可以从总共约 6000 万个键的集合中计算键对的增量值(浮点)。该程序将“相…

难理解 2025-01-11 03:36:12 1 0

MapReduce 未运行。 /bin/bash: /bin/java: 没有这样的文件或目录

我收到以下错误。 [2022-03-01 20:03:49.581]Container exited with a non-zero exit code 127. Error file: prelaunch.err. Last 4096 bytes of prel…

爱的那么颓废 2025-01-10 21:06:42 1 0

如何编写 MRJob python 进行矩阵加法

我一直在尝试使用 MRJob 库制作简单的矩阵加法程序。我已经创建了这个简单的程序,就像使用单独的映射器和减速器一样,它在本地和 Hadoop 集群上运行…

何必那么矫情 2025-01-10 20:20:51 0 0

Map-Reduce 等待

Map-Reduce 的概念非常熟悉。它似乎非常适合我试图解决的问题,但它要么遗漏了一些东西(要么我对这个概念缺乏足够的理解)。 我有一个项目流,结构如…

羅雙樹 2025-01-09 16:58:42 0 0

mongodb:未知的分片 m/r 字段:限制

当我在mapreduce分片集合中使用“limit”时,我看到这个错误: unknown m/r field for sharding: limit Code: m = function() { emit(this.user_id, 1…

谎言 2025-01-08 22:32:07 0 0

不使用循环计算单词数

我有一个关于 Ruby 的问题: 给定一个输入字符串,我需要返回一个散列,其键是字符串中的单词,其值是每个单词出现的次数。重要提示:我不能使用 for …

箹锭⒈辈孓 2025-01-08 21:09:30 1 0

在 Hadoop MapReduce 中解析 PDF 文件

我必须在 Hadoop 的 MapReduce 程序中解析 HDFS 中的 PDF 文件。所以我从 HDFS 获取 PDF 文件作为输入分割,它必须被解析并发送到 Mapper 类。为了实…

孤君无依 2025-01-08 18:29:42 2 0

使用 Hadoop 分区时出错

这就是我正在做的: public class MOPartition extends Partitioner { public MOPartition() {} ... } 错误: java.lang.RuntimeException:java.lang…

情感失落者 2025-01-08 13:42:09 0 0

MPI 标准和 Map-Reduce 编程模型之间的比较?

因为我已经了解了各种并行范例标准(例如 OpenMP、MPI、OpenCL)的基础知识来编写并行编程。但我对 Map-Reduce 编程模型了解不多。 众所周知,各种流…

多彩岁月 2025-01-08 12:36:37 0 0

RavenDB:排序、索引和投影

假设我有一个如下所示的模型: public class Blog { public string BlogId { get; set; } public string Name { get; set; } public DateTime Created…

情绪操控生活 2025-01-08 02:07:15 0 0

Map输出记录的数量小于hadoop中组合输入记录的数量

当我运行 MapReduce 时,我得到的组合输入记录大于映射输出记录?这实在是太奇怪了。我无法弄清楚究竟发生了什么?据我所知,地图输出记录应该与组合…

温柔女人霸气范 2025-01-08 00:20:45 0 0

如何查找 Hadoop 中 Map/Reduce 任务占用的 CPU 时间

我正在编写一个 Hadoop 调度程序。我的调度需要找到每个 Map/Reduce 任务占用的 CPU 时间。 我知道: TaskInProgress 类维护 execStartTime 和 execFi…

心奴独伤 2025-01-07 13:20:42 0 0

为 Disco mapreduce 作业指定输出 uri

我希望将已完成的 Disco 作业直接写入 mongodb。有没有一种简单的方法来指定 Disco 发送数据的输出 url?…

好菇凉咱不稀罕他 2025-01-07 11:49:00 0 0
更多

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文