aws-glue

aws-glue

文章 0 浏览 2

胶Pyspark错误:PyWritedYnamicFrame。 org.apache.parquet.column.values.dictionary.plainvaluesdictionary $ plainlongdictionary

我已经进行了2天的调试,并试图弄清楚发生了什么,而没有成功。 AWS支持也无法在这里帮助我,所以让我解释一下。 我有一个名为 provisioned.customer …

野心澎湃 2025-02-07 17:37:42 2 0

AWS胶:调用O100.PyWritedYnamicFrame时发生错误。无法找到数据来源:未知

运行胶水管道时会遇到以下 An error occurred while calling o100.pyWriteDynamicFrame. Failed to find data source: UNKNOWN. Please find packages…

话少心凉 2025-02-07 03:01:49 1 0

使用AWS胶创建雅典娜S3中存储的镶木质数据表

我想在S3存储桶中预览Athena数据。数据在镶木中。此doc 在这里描述如何描述如何描述使用AWS胶水创建预览。这里的一个强制性步骤是输入列详细信息。这…

奶气 2025-02-07 01:34:24 1 0

AWS胶 - 版本控制和设置连续集成

我们正在为AWS胶水ETL过程设置CI / CD过程。现有的ETL流程包含以下AWS胶组件 - 爬行者,目录中的注册表,作业,触发器和工作流程。 显然,第一步是设…

情仇皆在手 2025-02-06 20:36:55 3 0

我如何使用ExportTableTopointIntimereQuest等待导出完成?

我已经使用ExportTableTopointIntimeRequest API将DynamoDB表导出到Java中的S3。我想仅在完成导出完成时处理下一步,因为还与胶合作业相关联,它将读…

望笑 2025-02-06 02:00:13 1 0

创建或更新作业时,会自动运行AWS胶合作业

我有 AWS胶水作业设置以将测试数据上传到我们的数据库。上传仅进行1次,除非在测试数据上需要增加或更改,否则不需要额外的运行。但是,我们有多个需…

生寂 2025-02-05 18:19:30 2 0

JSON FOMPTING PYSPARK

我有一个以下格式存储为字符串的JSON, { 'aaa':'', 'bbb':'', 'ccc':{ 'ccc':[{dict of values}] //list of dictionaries } 'ddd':'', 'eee':{ 'eee'…

落花随流水 2025-02-05 07:32:40 1 0

为什么Gluestudio在AWS控制台中看到的脚本与Legacy Jobs视图不相同?

当我在S3(脚本路径)和Open Glue Studio中更新脚本时,我看不到此脚本的更新(pyspark)。但是,如果我打开传统作业,它将具有最新的代码。奇怪的是…

德意的啸 2025-02-04 22:53:10 2 0

XLX/XLXS文件和AWS胶

AWS的新手。电子表格XLX/XLXS文件是否可以在AWS胶水上工作? 我正在尝试为客户设置S3转储,文件将以多个选项卡的形式进行电子表格。…

放手` 2025-02-04 18:46:50 2 0

使用JQ替换后,将JSON传递给AWS胶水创建工作

我有以下我执行的bash脚本,以通过CLI创建新的胶作业: #!/usr/bin/env bash set -e NAME=$1 PROFILE=$2 SCRIPT_LOCATION='s3://bucket/scripts/'$1'.…

想你的星星会说话 2025-02-04 01:10:07 4 0

使用Awsglueml.transforms.findmatches使用AWS胶合作业,似乎随机地错误了

我有一个胶水ETL作业(使用PySpark),在尝试访问Awsglueml.transforms.findmatches库时,它似乎是随机的。胶水仪表板上的错误是: An error occurred…

伴我心暖 2025-02-03 12:41:23 3 0

AWS胶 - 从时间戳字段创建日期分区

字段 时间戳 框 的 具有 具有 数据 ​ ​ ​ ​代码>应用绘制将数据保存到新的S3位置。目前,我已经添加了 id 和版本通过在Visual编辑器中选择这些字…

始终不够爱げ你 2025-02-02 20:03:09 3 0

AWS CDK如何创建胶水工作室连接器

我需要为胶合作业创建一个自定义的火花连接器,但是我只能找到有关创建数据库连接而不是通过CDK连接器的信息。这甚至可能吗?…

胡渣熟男 2025-02-02 18:44:21 2 0

AWS GLUE按名称获取列

我有2种类型的CSV文件 - 一个包含10列,一根包含50列。第一个文件类型的10列也出现在第二个文件类型中,我只想从两个文件类型中抓取这10列。 将来,我…

烟若柳尘 2025-02-02 18:13:43 4 0

在AWS -Glue本地设置(Docker Image)上为Jupyter安装NBEXTENSION-获取权限问题

我正在尝试为我的jupyter笔记本安装nbextensions,但会遇到用户许可错误。在阅读了多个网站后,我添加了 - 用户,但是问题仍然存在。 这是在MacBook步…

路还长,别太狂 2025-02-02 16:37:07 3 0
更多

推荐作者

李珊平

文章 0 评论 0

Quxin

文章 0 评论 0

范无咎

文章 0 评论 0

github_ZOJ2N8YxBm

文章 0 评论 0

若言

文章 0 评论 0

南…巷孤猫

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文