hadoop

hadoop

文章 899 浏览 340

为什么Mapreduce中完成的任务数量减少了?

在运行 hadoop 作业时,我注意到有时已完成的任务数量会减少,而取消的任务数量会增加。 这怎么可能?为什么会发生这种情况?…

橘和柠 2024-12-06 21:05:28 2 0

如何在不删除源文件的情况下从HDFS加载数据到hive?

当使用命令将数据从 HDFS 加载到 Hive 时 LOAD DATA INPATH 'hdfs_file' INTO TABLE tablename; ,看起来像是将 hdfs_file 移动到 hive/warehouse 目…

铁憨憨 2024-12-06 20:36:26 0 0

使用hadoop流写入不同的文件

我目前正在 10 个服务器的 hadoop 集群上处理大约 300 GB 的日志文件。我的数据保存在名为 YYMMDD 的文件夹中,因此每天都可以快速访问。 我的问题是…

删除→记忆 2024-12-06 19:38:03 0 0

Mapreduce值列表顺序问题

正如我们所知,Hadoop 按每个键对值进行分组,并将它们发送到相同的reduce 任务。 假设我在 hdfs 上的文件中有下一行。 第1行 第2行 3号线 .... 亚麻…

戴着白色围巾的女孩 2024-12-06 18:07:44 2 0

Hadoop可以读取任意密钥的二进制文件

看起来Hadoop MapReduce需要文本或二进制文本中的键值对结构。 实际上,我们可能需要将文件分割成多个块来进行处理。但钥匙可能是 分布在整个文件中。…

小姐丶请自重 2024-12-06 18:00:30 0 0

是否可以添加“组合”进入 Amazon Elastic MapReduce 工作流程?

我指的是 Hadoop wiki 上提到的合并步骤。我无法在 AWS 文档中找到对此的参考,我想利用此步骤。…

忆离笙 2024-12-06 17:41:31 1 0

hadoop-streaming 示例运行失败 - 映射中的键类型不匹配

I was running $HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \ -D stream.map.output.field.separator=. \ -D stream.num.map.out…

帥小哥 2024-12-06 17:38:03 1 0

Hadoop java映射器作业在从节点上执行,目录问题

作为 Java 映射器的一部分,我有一个命令在本地从属节点上执行一些独立代码。当我运行代码时,它执行得很好,除非它尝试访问某些本地文件,在这种情况…

染柒℉ 2024-12-06 17:36:27 1 0

对于小文件来说轻快

我是 Cassandra 和 Hadoop 的新手。在寻找这两种产品的集成时,我遇到了 Brisk。从描述中我了解到 Brisk 取代了 CassandraFS 的 HDFS。所以这个替换是…

蓝眼泪 2024-12-06 16:11:47 1 0

Hadoop java映射器-copyFromLocal堆大小错误

作为 Java 映射器的一部分,我有一个命令在本地节点上执行一些代码并将本地输出文件复制到 hadoop fs。不幸的是我得到以下输出: VM初始化期间发生错…

沙与沫 2024-12-06 15:29:25 2 0

如何在hadoop的新api中设置setMaxMapTaskFailuresPercent?

以前,您可以使用以下命令设置最大失败百分比: JobConf.setMaxMapTaskFailuresPercent(int) 但现在,这已经过时了。 job.getConfiguration().set("ma…

赠佳期 2024-12-06 15:05:10 2 0

将数据输入转换为数据输入流?

java中如何将DataInput转换为DataInputStream? 我需要知道数据输入的大小。…

生生不灭 2024-12-06 14:17:35 0 0

String.getBytes() 和 Bytes.toBytes(字符串数据) 之间的区别

我正在编写 Hadoop/HBase 作业。我需要将 Java String 转换为字节数组。 Java 的 String.getBytes() 和 Hadoop 的 Bytes.toBytes() 之间有什么区别吗…

梦幻之岛 2024-12-06 12:37:48 0 0

如何转换 java.lang.Class到 java.lang.class;

请参阅底部的解决方案。 我正在尝试编写一些通用处理代码,但在其中一个子类中,它需要一个更具体的类。 因此,基类作为 Class 类型的字段,在子类中…

依 靠 2024-12-06 11:30:26 1 0

如何告诉 hadoop 为单个映射器作业分配多少内存?

我创建了一个 Elastic MapReduce 作业,并且正在尝试优化其性能。 目前我正在尝试增加每个实例的映射器数量。我通过 mapred.tasktracker.map.tasks.ma…

勿忘初心 2024-12-06 10:58:54 2 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文