第 3 页 - aws-glue - 文江博客

aws-glue

文章 0 浏览 2

胶Pyspark错误：PyWritedYnamicFrame。 org.apache.parquet.column.values.dictionary.plainvaluesdictionary $ plainlongdictionary

我已经进行了2天的调试，并试图弄清楚发生了什么，而没有成功。 AWS支持也无法在这里帮助我，所以让我解释一下。我有一个名为 provisioned.customer …

野心澎湃 2025-02-07 17:37:42 2 0

AWS胶：调用O100.PyWritedYnamicFrame时发生错误。无法找到数据来源：未知

运行胶水管道时会遇到以下 An error occurred while calling o100.pyWriteDynamicFrame. Failed to find data source: UNKNOWN. Please find packages…

话少心凉 2025-02-07 03:01:49 1 0

使用AWS胶创建雅典娜S3中存储的镶木质数据表

我想在S3存储桶中预览Athena数据。数据在镶木中。此doc 在这里描述如何描述如何描述使用AWS胶水创建预览。这里的一个强制性步骤是输入列详细信息。这…

奶气 2025-02-07 01:34:24 1 0

AWS胶 - 版本控制和设置连续集成

我们正在为AWS胶水ETL过程设置CI / CD过程。现有的ETL流程包含以下AWS胶组件 - 爬行者，目录中的注册表，作业，触发器和工作流程。显然，第一步是设…

情仇皆在手 2025-02-06 20:36:55 3 0

我如何使用ExportTableTopointIntimereQuest等待导出完成？

我已经使用ExportTableTopointIntimeRequest API将DynamoDB表导出到Java中的S3。我想仅在完成导出完成时处理下一步，因为还与胶合作业相关联，它将读…

望笑 2025-02-06 02:00:13 1 0

创建或更新作业时，会自动运行AWS胶合作业

我有 AWS胶水作业设置以将测试数据上传到我们的数据库。上传仅进行1次，除非在测试数据上需要增加或更改，否则不需要额外的运行。但是，我们有多个需…

生寂 2025-02-05 18:19:30 2 0

JSON FOMPTING PYSPARK

我有一个以下格式存储为字符串的JSON， { 'aaa':'', 'bbb':'', 'ccc':{ 'ccc':[{dict of values}] //list of dictionaries } 'ddd':'', 'eee':{ 'eee'…

落花随流水 2025-02-05 07:32:40 1 0

为什么Gluestudio在AWS控制台中看到的脚本与Legacy Jobs视图不相同？

当我在S3（脚本路径）和Open Glue Studio中更新脚本时，我看不到此脚本的更新（pyspark）。但是，如果我打开传统作业，它将具有最新的代码。奇怪的是…

德意的啸 2025-02-04 22:53:10 2 0

XLX/XLXS文件和AWS胶

AWS的新手。电子表格XLX/XLXS文件是否可以在AWS胶水上工作？我正在尝试为客户设置S3转储，文件将以多个选项卡的形式进行电子表格。…

放手` 2025-02-04 18:46:50 2 0

使用JQ替换后，将JSON传递给AWS胶水创建工作

我有以下我执行的bash脚本，以通过CLI创建新的胶作业： #!/usr/bin/env bash set -e NAME=$1 PROFILE=$2 SCRIPT_LOCATION='s3://bucket/scripts/'$1'.…

想你的星星会说话 2025-02-04 01:10:07 4 0

使用Awsglueml.transforms.findmatches使用AWS胶合作业，似乎随机地错误了

我有一个胶水ETL作业（使用PySpark），在尝试访问Awsglueml.transforms.findmatches库时，它似乎是随机的。胶水仪表板上的错误是： An error occurred…

伴我心暖 2025-02-03 12:41:23 3 0

AWS胶 - 从时间戳字段创建日期分区

字段时间戳框的具有具有数据代码>应用绘制将数据保存到新的S3位置。目前，我已经添加了 id 和版本通过在Visual编辑器中选择这些字…

始终不够爱げ你 2025-02-02 20:03:09 3 0

AWS CDK如何创建胶水工作室连接器

我需要为胶合作业创建一个自定义的火花连接器，但是我只能找到有关创建数据库连接而不是通过CDK连接器的信息。这甚至可能吗？…

胡渣熟男 2025-02-02 18:44:21 2 0

AWS GLUE按名称获取列

我有2种类型的CSV文件 - 一个包含10列，一根包含50列。第一个文件类型的10列也出现在第二个文件类型中，我只想从两个文件类型中抓取这10列。将来，我…

烟若柳尘 2025-02-02 18:13:43 4 0

在AWS -Glue本地设置（Docker Image）上为Jupyter安装NBEXTENSION-获取权限问题

我正在尝试为我的jupyter笔记本安装nbextensions，但会遇到用户许可错误。在阅读了多个网站后，我添加了 - 用户，但是问题仍然存在。这是在MacBook步…

路还长，别太狂 2025-02-02 16:37:07 3 0

共 12 页
上一页
1
2
3
4
5
下一页

友情链接

文江博客