第 14 页 - MapReduce - 文江博客

投稿关注

MapReduce

文章 106 浏览 158

对于复杂类型，Reducer 中的 ReadFields() 中的空缓冲区

我试图在映射器和化简器之间传递一个复杂的可写对象，更具体地说是 ObjectWritables 的 ArrayWritable。 public class ObjectArrayWritable extends A…

春庭雪 2024-11-05 05:18:54 2 0

Hadoop 流作业在 python 中失败

我有一个用 Python 编写的 MapReduce 作业。该程序在linux环境下测试成功，但在Hadoop下运行时失败。作业命令如下： hadoop jar $HADOOP_HOME/contri…

伴梦长久 2024-11-05 03:44:55 5 0

如何修复“任务尝试_201104251139_0295_r_000006_0 未能报告状态 600 秒。”

我编写了一个 MapReduce 作业来从数据集中提取一些信息。该数据集是用户对电影的评分。用户数量约25万，电影数量约30万。 map 的输出为 *>和*>。在减…

走野 2024-11-04 20:25:49 4 0

带有两个 jar 的 Hadoop Mapreduce（仅在 namenode 上需要其中一个 jar）

mapred 任务是一个由 Java 实现的非常简单的“字数统计”（请参阅 http://wiki.apache。 org/hadoop/WordCount ）。在最后一行之后，“job.waitF…

別甾虛僞 2024-11-04 18:32:52 3 0

带有选择查询的 MapReduce 示例

我正在使用谷歌应用程序引擎和 python 构建一个网站。目前我在搜索大数据时遇到一个问题。当我执行如下查询时：（ student = Student.all().filter('…

心如狂蝶 2024-11-04 13:08:23 5 0

为什么我使用 iteratee IO 的 Mapreduce 实现（现实世界的 haskell）也会失败，并出现“打开文件过多”的错误？

我正在实现一个 haskell 程序，它将文件的每一行与文件中的每一行进行比较。可以按如下方式实现单线程 distance :: Int -> Int -> Int distance a b =…

划一舟意中人 2024-11-04 08:30:58 6 0

远程执行hadoop作业时出现异常

我正在尝试在远程 hadoop 集群上执行 Hadoop 作业。下面是我的代码。 Configuration conf = new Configuration(); conf.set("fs.default.name", "hdfs…

魂归处 2024-11-04 06:50:03 4 0

MapReduce 中的容错

我正在阅读有关 Hadoop 及其容错能力的内容。我阅读了 HDFS 并阅读了如何处理主节点和从节点的故障。但是，我找不到任何提到 MapReduce 如何执行容错…

Smile简单爱 2024-11-03 18:32:00 7 0

MapReduce 洗牌/排序方法

有点奇怪的问题，但是有人知道 MapReduce 在 shuffle/sort 的排序部分中使用哪种排序吗？我认为合并或插入（与整个 MapReduce 范例保持一致），但我不…

愛放△進行李 2024-11-03 15:56:25 4 0

Couchdb map/reduce 返回流中的第一个，然后按时间排序

我有一个 couchdb，它保存一系列事件。每个事件都有一个所有者、一个 ID、发生的时间和一条消息（加上一堆与本练习无关的其他内容）。我想要一份最近…

纵山崖 2024-11-03 14:15:51 4 0

如何使用 Map-Reduce 进行查找（或连接）？

如何使用“纯”map-reduce 框架获取输入集 {worker-id:1 name:john supervisor-id:3} {worker-id:2 name:jane supervisor-id:3} {worker-id:3 name:bo…

拥抱影子 2024-11-02 23:32:30 6 0

想要比较 Hadoop 上的两个连续作业

我想知道是否可以比较 Hadoop 中的两个连续作业。如果没有，如果有人能告诉我如何继续，我将不胜感激。准确地说，我想根据两项工作到底做了什么来比较…

暗地喜欢 2024-11-02 20:44:59 5 0

运行 Hadoop MapReduce 作业时如何获取文件名/文件内容作为 MAP 的键/值输入？

我正在创建一个程序来分析 PDF、DOC 和 DOCX 文件。这些文件存储在 HDFS 中。当我开始 MapReduce 作业时，我希望映射函数将文件名作为键，将二进制内…

寄离 2024-11-02 09:39:11 6 0

如何在作业完成之前在hadoop中重新运行整个map/reduce？

我使用 Hadoop Map/Reduce 使用 Java 假设，我已经完成了整个 Map/Reduce 工作。有什么方法可以重复整个映射/减少部分，而不结束工作。我的意思是，我…

∞琼窗梦回ˉ 2024-11-02 05:00:05 3 0

我们可以用 OpenCL 做什么？

我一直在阅读有关 OpenCL 的内容，并发现了这一行： OpenCL 允许任何应用程序访问图形处理单元以进行非图形计算。假设我需要在 Java 或 Clojure 中执…

悲歌长辞 2024-11-02 01:17:13 7 0

隔纱相望

文章 0 评论 0

关注

昵称有卵用

文章 0 评论 0

关注

梨涡

文章 0 评论 0

关注

蓝咒

文章 0 评论 0

关注

白芷

文章 0 评论 0

关注

樱娆

文章 0 评论 0

友情链接

文江博客

MapReduce

对于复杂类型，Reducer 中的 ReadFields() 中的空缓冲区

Hadoop 流作业在 python 中失败

如何修复“任务尝试_201104251139_0295_r_000006_0 未能报告状态 600 秒。”

带有两个 jar 的 Hadoop Mapreduce（仅在 namenode 上需要其中一个 jar）

带有选择查询的 MapReduce 示例

为什么我使用 iteratee IO 的 Mapreduce 实现（现实世界的 haskell）也会失败，并出现“打开文件过多”的错误？

远程执行hadoop作业时出现异常

MapReduce 中的容错

MapReduce 洗牌/排序方法

Couchdb map/reduce 返回流中的第一个，然后按时间排序

如何使用 Map-Reduce 进行查找（或连接）？

想要比较 Hadoop 上的两个连续作业

运行 Hadoop MapReduce 作业时如何获取文件名/文件内容作为 MAP 的键/值输入？

如何在作业完成之前在hadoop中重新运行整个map/reduce？

我们可以用 OpenCL 做什么？

热门标签

推荐作者

隔纱相望

昵称有卵用

梨涡

蓝咒

白芷

樱娆

友情链接