hadoop-yarn

hadoop-yarn

文章 0 浏览 5

EMR,Spark:适当的本地共享缓存位置

在我们的Spark应用程序中,我们将本地应用程序缓存存储在/mnt/YARN/APP-CACHE/目录中,该目录在同一EC2实例 /mnt/... 上共享应用程序容器之间共享。选…

无语# 2025-02-13 04:12:18 1 0

Spark与不寻常编码的CSV文件不一致

上下文: 作为数据管道的一部分,我正在处理一些平面CSV文件, 这些文件具有不寻常的编码和逃避规则, 我的意图太预处理了,然后将其转换为parquets,…

别忘他 2025-02-12 11:31:52 1 0

Spark Sc.BinaryFiles()分区小文件和纱线

使用hortonworks 2.6.5服务器上的Spark 2.3.0中的SC.BinaryFiles()函数,我注意到它的行为,我无法在纱线托管群集中进行有关默认分区的解释。请参阅…

像你 2025-02-12 06:58:27 0 0

如何在色调中同时运行多个查询?

如果我开始第二个查询,则第一个查询将自动杀死。 因此,色相/蜂巢/tez/纱线的任何配置都可以控制此最大并发吗? 错误信息: org.apache.hive.service…

梦幻的味道 2025-02-10 08:46:25 2 0

我无法在AWS EMR上运行Dask纱线群

我想使用YarnCluster在EMR上运行Dask。 我已经在下面使用了Bootstrap脚本,但是我已经在SSH控制台中运行了这些说明。 #!/bin/bash HELP="Usage: boots…

毁梦 2025-02-10 07:32:44 0 0

Hadoop资源管理器页面无法从Windows WSL打开

我已经使用此页面在Windows WSL Ubuntu-22.04上安装和运行Hadoop:。 看起来Hadoop已经开始了: hadoopuser@hostname:~$ jps 1840 NodeManager 993 Na…

如歌彻婉言 2025-02-09 11:01:04 2 0

读取嵌套CSV Spark Scala的数据

我有一个要求,就像我有一个带有3个标题的CSV文件。名称,年龄,地址。但是地址列值也包含“,”。因此,在加载CSV文件后,我得到的所有值是null。 In…

黯淡〆 2025-02-08 19:32:05 0 0

气流emraddstepsoperator无法执行火花阴影罐

Spark App的步骤类型应该是什么。.我面临的问题是,主类型未设置或无法识别纱线..似乎将应用程序视为简单的jar而不是Spark提交模式。 dag,error和emr…

岁月如刀 2025-02-05 09:22:31 2 0

如何查看Hadoop(安装在EC2上)纱线UI

这在我的yarn-site.xml中 ......... sudo nano $ hadoop_home/etc/hadoop/yarn-site.xml ........ 无法在public_ip_of_ec2上看到YARN UI:8088端口 ya…

梦醒时光 2025-02-03 20:54:21 4 0

我可以在较旧版本中使用Hadoop纱线的Docker运行时功能(Hadoop 2.7.3)

YARN提供了将Linux Executor容器与Docker Runtime一起使用的功能,较早的YARN提供了创建Docker Executor容器而不是Linux Executor容器的功能,因此我…

说好的呢 2025-02-02 20:42:25 5 0

在RM UI上杀死应用程序延迟

我想在运行数小时后杀死MR流程,然后在RM Web UI上单击杀死应用程序 但是有时候工作不会立即结束。 小数据集的纱线集群(RM)并不忙于 MR,其延迟 …

痞味浪人 2025-02-01 18:12:31 7 0

在Docker容器中运行Node Manager并添加到现有的Hadoop群集中

我已经使用Ambari创建了一个Hadoop群集,现在我需要在新的VM上创建一个Docker,该Docker需要加入此Hadoop群集,并且Docker容器应运行NodeManager。…

忆梦 2025-01-30 03:27:36 4 0

如何使用纱线rentful API指定节点标签

我已经在纱线中设置了几个节点标签,但是我未能通过 yarn rentful api 。应用程序状态被接受,默认 AM容器节点标签表达式 IS < default_partition…

自由如风 2025-01-29 08:47:59 2 0

Hadoop MapReduce执行卡

我在VM上使用Hadoop。当我尝试运行jar时,执行会停止,因为无法找到文件资源type.xml。 我该如何解决?谢谢。 gaia@gaia-virtual-machine:~/hadoop-3.…

长梦不多时 2025-01-27 17:54:07 6 0

Spark - 名称选项尚不清楚

我不明白这个选项。似乎是执行者的最大人数。 如果群集中的节点上没有足够的内存,则该数字无需做任何事情,而执行者却少于我要求的。 有人可以澄清一…

沩ん囻菔务 2025-01-27 03:47:22 3 0
更多

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文