MapReduce

MapReduce

文章 106 浏览 158

对于复杂类型,Reducer 中的 ReadFields() 中的空缓冲区

我试图在映射器和化简器之间传递一个复杂的可写对象,更具体地说是 ObjectWritables 的 ArrayWritable。 public class ObjectArrayWritable extends A…

春庭雪 2024-11-05 05:18:54 2 0

Hadoop 流作业在 python 中失败

我有一个用 Python 编写的 MapReduce 作业。该程序在linux环境下测试成功,但在Hadoop下运行时失败。 作业命令如下: hadoop jar $HADOOP_HOME/contri…

伴梦长久 2024-11-05 03:44:55 5 0

如何修复“任务尝试_201104251139_0295_r_000006_0 未能报告状态 600 秒。”

我编写了一个 MapReduce 作业来从数据集中提取一些信息。该数据集是用户对电影的评分。用户数量约25万,电影数量约30万。 map 的输出为 *>和*>。在减…

走野 2024-11-04 20:25:49 4 0

带有两个 jar 的 Hadoop Mapreduce(仅在 namenode 上需要其中一个 jar)

mapred 任务是一个由 Java 实现的非常简单的“字数统计”(请参阅​​ http://wiki.apache。 org/hadoop/WordCount )。 在最后一行之后,“job.waitF…

別甾虛僞 2024-11-04 18:32:52 3 0

带有选择查询的 MapReduce 示例

我正在使用谷歌应用程序引擎和 python 构建一个网站。 目前我在搜索大数据时遇到一个问题。当我执行如下查询时:( student = Student.all().filter('…

心如狂蝶 2024-11-04 13:08:23 5 0

为什么我使用 iteratee IO 的 Mapreduce 实现(现实世界的 haskell)也会失败,并出现“打开文件过多”的错误?

我正在实现一个 haskell 程序,它将文件的每一行与文件中的每一行进行比较。可以按如下方式实现单线程 distance :: Int -> Int -> Int distance a b =…

划一舟意中人 2024-11-04 08:30:58 6 0

远程执行hadoop作业时出现异常

我正在尝试在远程 hadoop 集群上执行 Hadoop 作业。下面是我的代码。 Configuration conf = new Configuration(); conf.set("fs.default.name", "hdfs…

魂归处 2024-11-04 06:50:03 4 0

MapReduce 中的容错

我正在阅读有关 Hadoop 及其容错能力的内容。我阅读了 HDFS 并阅读了如何处理主节点和从节点的故障。但是,我找不到任何提到 MapReduce 如何执行容错…

Smile简单爱 2024-11-03 18:32:00 7 0

MapReduce 洗牌/排序方法

有点奇怪的问题,但是有人知道 MapReduce 在 shuffle/sort 的排序部分中使用哪种排序吗?我认为合并或插入(与整个 MapReduce 范例保持一致),但我不…

愛放△進行李 2024-11-03 15:56:25 4 0

Couchdb map/reduce 返回流中的第一个,然后按时间排序

我有一个 couchdb,它保存一系列事件。每个事件都有一个所有者、一个 ID、发生的时间和一条消息(加上一堆与本练习无关的其他内容)。我想要一份最近…

纵山崖 2024-11-03 14:15:51 4 0

如何使用 Map-Reduce 进行查找(或连接)?

如何使用“纯”map-reduce 框架获取输入集 {worker-id:1 name:john supervisor-id:3} {worker-id:2 name:jane supervisor-id:3} {worker-id:3 name:bo…

拥抱影子 2024-11-02 23:32:30 6 0

想要比较 Hadoop 上的两个连续作业

我想知道是否可以比较 Hadoop 中的两个连续作业。如果没有,如果有人能告诉我如何继续,我将不胜感激。准确地说,我想根据两项工作到底做了什么来比较…

暗地喜欢 2024-11-02 20:44:59 5 0

运行 Hadoop MapReduce 作业时如何获取文件名/文件内容作为 MAP 的键/值输入?

我正在创建一个程序来分析 PDF、DOC 和 DOCX 文件。这些文件存储在 HDFS 中。 当我开始 MapReduce 作业时,我希望映射函数将文件名作为键,将二进制内…

寄离 2024-11-02 09:39:11 6 0

如何在作业完成之前在hadoop中重新运行整个map/reduce?

我使用 Hadoop Map/Reduce 使用 Java 假设,我已经完成了整个 Map/Reduce 工作。有什么方法可以重复整个映射/减少部分,而不结束工作。我的意思是,我…

∞琼窗梦回ˉ 2024-11-02 05:00:05 3 0

我们可以用 OpenCL 做什么?

我一直在阅读有关 OpenCL 的内容,并发现了这一行: OpenCL 允许任何应用程序访问图形处理单元以进行非图形计算。 假设我需要在 Java 或 Clojure 中执…

悲歌长辞 2024-11-02 01:17:13 7 0
更多

推荐作者

隔纱相望

文章 0 评论 0

昵称有卵用

文章 0 评论 0

梨涡

文章 0 评论 0

蓝咒

文章 0 评论 0

白芷

文章 0 评论 0

樱娆

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文