第 2 页 - amazon-emr - 文江博客

投稿关注

amazon-emr

文章 0 浏览 5

如何使用MWAA气流DAG克隆EMR群集

我想从EMR侧克隆预先存在的群集 /先前的终止群集。但是，我想使用MWAA ENV的气流DAG实现这一目标，而不是手动进行。当前，我能够使用 emraddstepsop…

楠木可依 2025-02-06 07:28:05 3 0

使用Java连接到EMR HBase

我正在尝试从EMR 5.35（Hadoop 2.10，Spark 2.4.8，HBase 1.4.13）上运行的SPARK程序连接到HBase。当不尝试连接到HBASE时，我的Spark程序运行完美。 …

野稚 2025-02-06 03:25:14 3 0

气流emraddstepsoperator无法执行火花阴影罐

Spark App的步骤类型应该是什么。.我面临的问题是，主类型未设置或无法识别纱线..似乎将应用程序视为简单的jar而不是Spark提交模式。 dag，error和emr…

岁月如刀 2025-02-05 09:22:31 2 0

EMR-DYNAMODB-CONNECTOR CORTAND/TOMTLETE写入DDB（吞吐量超过您帐户的当前吞吐量限制。）

我试图将1 TB / 3000万个文档写入DDB表。 DDB表设置为按需容量。为此，我正在使用 emr-dynamodb-connector 通过在EMR群集上运行Spark作业。代码如下…

十二 2025-02-04 04:05:39 5 0

EMR上的CPU利用率不平衡

IAM使用长期运行的EMR -HBase群集与1个主，3个核心和1个任务节点。这些工作负载仅在HBASE和常规备份中使用MapReduce作业进行读/写操作。目前，我注意…

夏日落 2025-02-03 08:56:54 3 0

HADDOP fileOutputformat.setOutputPath问题

我在为Hadoop工作设置输出格式时遇到了问题。使用Amazon EMR运行代码时，我会将其转到STDERR： Exception in thread "main" java.lang.IllegalAccess…

渔村楼浪 2025-02-03 05:02:23 5 0

Hikari Nosuchmethoderror在AWS EMR/SPARK上

我正在尝试将 EMR 从 5.13 升级为 5.35 使用 spark-2.4.8 。我要使用的罐子对 hikaricp：4.0.3 的依赖性为设置db pool-config setkekepalivetime 。虽…

宁愿没拥抱 2025-02-01 00:10:14 1 0

EMR笔记本访问HDFS

如果我在EMR笔记本中并保存类似于.save（'model.sav'）的模型，它可以保存何处以及如何使用HDFS DFS命令（HDFS路径）引用它？…

流年已逝 2025-01-31 15:53:24 4 0

从火花数据框架上的熊猫执行预处理操作

我有一个相当大的CSV，因此我使用AWS EMR将数据读取到Spark DataFrame中以执行一些操作。我有一个熊猫功能，可以进行一些简单的预处理： def clean_ce…

蓝戈者 2025-01-30 02:59:36 4 0

是否可以使用AWS EMR作为Spark Master/驱动程序运行kubeflow管道或笔记本

我正在尝试在EKS群集上实现作为解决方案，其中预计用户/开发人员使用Kubeflow Central仪表板提交作业。为了将Spark作为平台上的用户服务，我试图在EKS…

沫尐诺 2025-01-29 15:07:05 3 0

使用Java Spring Boot Client从AWS EMR群集上读取HBASE的数据的问题

我正在尝试编写一个简单的API应用程序，以在AWS EMR群集上读取HBASE的数据。但是，当我尝试发送请求时，我会得到一个 sockettimeoutexception ＆nbsp;…

落墨 2025-01-28 12:46:29 3 0

亚马逊EMR群集是否可以在免费订阅试验中消除？

我是使用簇的新手。我在jupyter笔记本上有一个Pyspark程序，我想在集群上部署它。我发现的两个教程使用了 Microsoft Azure 和 Amazone EMR 。我尝试…

箜明 2025-01-28 00:31:48 4 0

jupyter笔记本pyspark内核参考从主机机器网站包装降低PIP版本

我使用的是由AWS托管服务EMR Studio提供的Jupyter笔记本。我对这些笔记本如何工作的理解是，它们是在我作为EMR群集的一部分提供的EC2实例上托管的。特…

陪你到最终 2025-01-27 09:16:53 1 0

Flink Rest API： /JARS /上传返回404

以下是我的代码片段，用于将jar上传到弗林克中。我正在为此帖子请求获得404响应。以下是请求的输出。我还尝试使用/v1/jars/上传更新URL，但响应相同。…

夏了南城 2025-01-27 04:58:11 3 0

调用O137.分区时发生错误。：org.apache.hadoop.mapred.invalidinputexception：不存在输入路径：hdfs：// ip ip

我正在尝试在AWS EMR Spark群集中执行此GitHub项目我已经成功运行了2个FISRT代码 tweet_stream_producer.py sparkml_train_model.py，但是当我使用…

泪眸﹌ 2025-01-27 02:44:01 5 0

共 7 页
上一页
1
2
3
4
5
下一页

友情链接

文江博客