amazon-emr

投稿关注

文章 0 浏览 5

presto/trino可以阅读蜂巢视图

我一直在尝试使用胶水数据目录和EMR上的Presto/Trino查询一些非常简单的Hive视图，但没有运气。该错误要么是“找不到”或“不支持的蜂巢视图”。我试…

筱武穆 2025-02-14 00:15:34 0 0

EMR Serverless无法连接到另一个区域中的S3

我有一个无法连接到其他区域中S3存储桶的EMR无服务器应用程序。有解决方法吗？也许是在提交新作业时在作业参数或火花参数中设置的参数。错误是： Exi…

别想她 2025-02-13 07:26:13 0 0

EMR，Spark：适当的本地共享缓存位置

在我们的Spark应用程序中，我们将本地应用程序缓存存储在/mnt/YARN/APP-CACHE/目录中，该目录在同一EC2实例 /mnt/... 上共享应用程序容器之间共享。选…

无语# 2025-02-13 04:12:18 1 0

Spark与不寻常编码的CSV文件不一致

上下文：作为数据管道的一部分，我正在处理一些平面CSV文件，这些文件具有不寻常的编码和逃避规则，我的意图太预处理了，然后将其转换为parquets，…

别忘他 2025-02-12 11:31:52 1 0

ModulenotFoundError：NO模块名为＆＃x27; boto3＆＃x27;

我有一个AWS EMR群集，所有步骤都失败了，错误： ''' ModuleNotFoundError: No module named 'boto3' ''' Python和Pip版本： '' python --version Pyt…

白色秋天 2025-02-12 07:29:17 1 0

如何在火花集群上编程获取数量可用节点

我正在尝试通过让我的Java Spark应用程序自动计算可在进行分区的可用核心数量来删除在我的Spark-Submit中添加参数的手动步骤。希望能确定一个解决方案…

岁月无声 2025-02-11 17:40:31 1 0

是否可以使用EMR使用自定义Hadoop版本？

截至今天（2022-06-28），AWS EMR最新版本为6.6.0，使用Hadoop 3.2.1。我需要使用不同的Hadoop版本（3.2.2）。我尝试了以下方法，但它行不通。您可以…

北座城市 2025-02-11 07:46:55 3 0

如何在托管缩放集群中保持在Conf/Masters和Conf/工人的持续师父和工人列表？

我使用的是AWS EMR群集，每个节点都安装了Aluxio。我现在想在高可用性中部署Alluxio。 https://docs.alluxio.io.io/os/oser/stable/en/deploy/running…

长梦不多时 2025-02-11 06:52:55 0 0

我无法在AWS EMR上运行Dask纱线群

我想使用YarnCluster在EMR上运行Dask。我已经在下面使用了Bootstrap脚本，但是我已经在SSH控制台中运行了这些说明。 #!/bin/bash HELP="Usage: boots…

毁梦 2025-02-10 07:32:44 0 0

EMR主节点与EMR笔记本中的软件包列表中的软件包列表

我有一个EMR群集启动并运行。在其中，我有一个带有 pyspark 内核的jupyter笔记本。对于主节点，我可以将 ssh 进入其中。我可以轻松地在主节点中安装P…

东京女 2025-02-09 06:39:41 3 0

如何运行地图降低了Emrserverless上的作业？

基于文档仅接受火花和蜂巢作为求职者。是否有任何支持…

星星的轨迹 2025-02-09 00:11:43 0 0

是否有一种使用Pyspark编写许多小文件的最佳方法？

我有一个工作，需要在Spark DataFrame中为每行写一个JSON文件，以将其写入S3（然后由另一个过程拾取）。 df.repartition(col("id")).write.mode("over…

蔚蓝源自深海 2025-02-08 20:25:04 2 0

使用AWS步骤函数使用EMR无服务器的工作编排

最近，亚马逊推出 aws aws步骤步骤功能，：有一些步骤可以创建EMR群集，运行一些lambda功能，提交Spark作业（主要是使用Spark-Submit的Scala作业），…

春风十里 2025-02-06 17:52:11 2 0

检索XCOMM值并将其传递给EMR操作员，气流

我正在尝试从Python运营商中检索价值，并将其传递给“ EMR创建作业”和“添加步骤操作员”。我如何在spark_steps中传递此值，我已经使用task_instanc…

知你几分 2025-02-06 15:55:08 4 0

如何从Python函数中检索数据并将其用于EMR操作员

气流版本：2.0.2 试图通过从AWS Secrets Manager中重试数据来创建EMR群集。我正在尝试编写气流DAG，我的任务是从此get_secret函数中获取数据，并在sp…

紫瑟鸿黎 2025-02-06 13:26:39 3 0

共 7 页
1
2
3
4
5
下一页

友情链接

文江博客