hadoop

hadoop

文章 899 浏览 342

Hadoop单节点安装-格式错误-序言中不允许内容

我正在尝试进行 hadoop 单节点安装。 我正在关注 这篇文章提供了 hadoop 安装说明。我需要做的步骤之一是使用命令 hduser@dbserver:~/hadoop/conf$ /h…

得不到的就毁灭 2025-01-03 10:49:23 0 0

如何消除hadoop mapreduce中的重复文件名?

我想消除 hadoop mapreduce 倒排索引程序输出中的重复文件名。例如,输出类似于 - things : doc1,doc1,doc1,doc2 但我希望它像 事物:doc1,doc2 …

∞琼窗梦回ˉ 2025-01-03 08:21:02 0 0

数据局部性(如果不使用 HDFS)

当您为 Hadoop 的 Map/Reduce 部分提供除 HDFS 之外的不同存储(如 MySql 服务器等)时,它的数据局部性功能会发生什么情况?换句话说,我的理解是Had…

谜兔 2025-01-03 06:56:14 1 0

在 Amazon MapReduce 上调用已编译的二进制文件

我正在尝试在 Amazon Elastic MapReduce 上进行一些数据分析。映射器步骤是一个 python 脚本,其中包含对名为“./formatData”的已编译 C++ 二进制文…

極樂鬼 2025-01-03 06:03:49 2 0

需要安装 hadoop 的帮助

我是 Hadoop 新手,并尝试使用 cygwin 将其安装在我的 Windows 7 (x64) PC 上。 我按照本教程安装 http://alans。 se/blog/2010/hadoop-hbase-cygwin-…

友谊不毕业 2025-01-02 23:37:41 1 0

无法从映射器 Hadoop 打开 HDFS 文件

我进行了很多搜索,但未能找到解决这个问题的方法。 实际上我想要访问的文件位于 HDFS 中,但不在输入路径(输入到 Map/Reduce 作业的路径)中。我想…

高冷爸爸 2025-01-02 22:41:51 0 0

在 32 位处理器的 Windows 7 上安装 Hadoop?

我有一台 Windows 7 的 32 位机器, 我需要安装 hadoop 并尝试一下,我检查了 Cloudera 发行版,它适用于 64 位处理器的 Linux、VMWare 映像。 如何在…

流殇 2025-01-02 20:54:51 0 0

hadoop dfs -ls 抱怨

谁能让我知道这里似乎出了什么问题? hadoop dfs 命令似乎没问题,但无法识别以下任何选项。 [hadoop-0.20]$bin/hadoop dfs -ls ~/wordcount/input/ l…

别再吹冷风 2025-01-02 20:48:43 1 0

如何向Hadoop作业报告进度以避免任务超时被杀死?

1) 我有一个仅映射的 Hadoop 作业,它将数据流式传输到 Cassandra 集群。 2) 有时,流式传输需要超过 10 分钟,并且由于进度未报告给作业,因此会终止…

绝不放开 2025-01-02 20:38:57 0 0

Hadoop 每个文件块大小

在 Hadoop 书中,我们可以在创建文件时指定每个文件的块大小。 “增加分割大小的最自然的方法是通过设置 dfs.block.size 或在文件构建时基于每个文件…

叹倦 2025-01-02 17:53:35 0 0

Eclipse Hadoop 插件显示“java.io.EOFException”尝试连接时

我正在尝试使用此 page 我正在使用 此处 我的 core-site.xml 看起来如下: ; fs.default.name hdfs://localhost:54310 默认文件系统的名称。一个 URI…

寻梦旅人 2025-01-02 17:36:37 0 0

带附加功能的 HDFS 是如何工作的

假设一个文件使用默认块大小 (128 MB),并且有一个文件使用 130 MB;因此使用 1 个全尺寸块和 1 个 2 MB 块。然后需要将 20 MB 附加到文件中(现在总…

浅忆流年 2025-01-02 12:46:12 2 0

读取 PIG 中的文件,其中 delemeter 包含数据

我想使用 PIG 读取 CSV 文件,我该怎么办?我使用了 load n pigstorage(',') 但它无法正确读取 CSV 文件,因为它在数据中遇到逗号 (,) 时会将其分割。…

看春风乍起 2025-01-02 11:50:03 1 0

gzip 输入文件大小 > 的问题64MB

我正在运行 Hadoop 流作业,它只有映射器,没有减速器。我为这项工作提供了 4 个输入文件,这些文件都经过 gzip 压缩,以确保每个输入文件都发送到一…

行至春深 2025-01-02 10:42:18 0 0

NetBeans 分析器“停止工作” 50 个线程限制之后?

我正在尝试使用 NetBeans 7.1 分析器来分析运行一系列 hadoop 任务(本地、单进程)的程序,但每个任务都在单独的线程中启动。 我已将我的根方法设置…

谎言月老 2025-01-02 08:53:14 1 0
更多

推荐作者

卷耳

文章 0 评论 0

佚名

文章 0 评论 0

℉服软

文章 0 评论 0

qq_2gSKZM

文章 0 评论 0

凉宸

文章 0 评论 0

gyhjy

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文