aws-glue

aws-glue

文章 0 浏览 2

不要选择选择XML作为AWS胶水中的来源

我正在尝试学习AWS胶水。我在S3中有一个XML,需要用作源。 但是,我没有选择 XML 作为数据格式。为什么? 这些是我唯一的选择: 我如何在AWS胶中解析X…

懷念過去 2025-01-23 03:56:32 4 0

Pyspark DataFrames与GLUE DYAMICFRAMES的性能

因此,我最近首次开始使用Glue和Pyspark。任务是创建一个执行以下操作的胶作业: 来自S3存储桶中的Parquet文件的加载数据 将过滤器应用于数据 添加列…

过潦 2025-01-22 19:14:58 2 0

使用胶的增量ETL

在处理增量文件时需要帮助。 方案:源团队在S3中每1小时创建文件(HRLY分区)。我想在每4小时内进行处理。胶水ETL将读取S3文件(分区的HRLY)和流程以…

倾城花音 2025-01-22 14:20:33 2 0

如何保留使用Serde的胶水中的JSON键的情况?

我创建了一个胶水表,该表将JSON转换为Parquet文件。在列之一中,该列定义为 map< string,string> 具有嵌套的json。我看到嵌套的json键正在…

噩梦成真你也成魔 2025-01-22 12:28:31 1 0

AWS GLUE 3.0 -PYSPARK的铸造问题

我正在使用胶3.0 data = [("Java", "6241499.16943521594684385382059800664452")] rdd = spark.sparkContext.parallelize(data) df = rdd.toDF() df.…

清引 2025-01-22 12:25:35 4 0

AWS步骤函数操作GetJob(AWS胶水)尽管文档说应该,但我缺少什么文档,但仍未返回CodegenconFigurationNodes?

根据 https://docs.aws.amazon.com/glue/latest/dg/aws-glue-api-jobs-job.html#aws-glue-api-jobs-jobs-jobs-job-job-job-getjob-getjob 操作GetJob…

囍笑 2025-01-22 11:16:34 6 0

如果文件夹名称使用AWS GLUE或LAMBDA匹配,则将文件夹从AWS存储库中的一个文件夹复制到另一个文件夹

我有2个AWS存储桶登台,目的地都具有相同数量的子文件夹,让我们假设3。 如此登台的3个名称为A,B,C和目的地具有3 a,b,c。现在,我想从3个子文件夹…

悸初 2025-01-22 07:56:11 3 0

胶水工作成功,但没有插入目标表(Aurora mysql)的数据

我使用以下“视觉”选项卡创建了一个胶水作业。首先,我将数据源连接到MySQL表中,该数据源已经在我的数据目录中。然后,在“转换节点”中,我编写了…

仅冇旳回忆 2025-01-22 07:36:15 6 0

AWS GLUE NOCLASSDEFFOUNDERROR在Job.init()上

尝试使用GLUE ETL库在本地调试AWS胶水脚本。 我已经安装了AWS-Glue-libs和Spark-3.1.1-AMZN-0-BIN-3.2.1-AMZN-3.TGZ。 当我运行 job.init()时,我会…

无妨# 2025-01-22 03:47:55 4 0

胶水状态显示状态成功,但红移视图不令人耳目一新

我正在使用胶水来刷新红移视图和桌子。桌子存储在S3中,我正在拿起这些桌子并用Redhshit写作。 当我提供单个表作为输入(没有任何循环或定义变量)时…

走过海棠暮 2025-01-21 22:18:05 2 0

尝试在Mac上的AWS_GLUE的Docker图像上运行Pyspark代码

我遇到的以下错误。 该代码由于致命错误而失败。有些事情要尝试:a)确保Spark为Jupyter提供足够的可用资源来创建火花上下文。 b)与您的Jupyter管理…

念﹏祤嫣 2025-01-21 21:19:55 1 0

无法写出湖层的湖泊形成数据

我正在使用湖泊组建造一个POC,在其中阅读了火车移动信息的队列,并使用AWS Data Wrangler将单个事件持续到主管表中。这很好。 然后,我试图用AWS胶水…

耶耶耶 2025-01-21 19:29:32 5 0

使用AWS CDK从EventBridge触发AWS GLUE WORKLFOW

如此链接,它不受2级构造的支持。但是,可以使用1级构造来实现它。谁能使用1级结构向我展示如何进行或给我一个例子?非常感谢。…

孤独岁月 2025-01-21 15:44:31 2 0

如何执行REST API呼叫胶水动态帧

我需要构建GLUE SPARK应用程序来转换原始事件,然后执行REST API以推动转换的数据。我正在使用胶水动态框架来转换原始事件,但无法执行REST API调用。…

梦开始←不甜 2025-01-21 08:38:04 3 0

AWS GLUE SQL与右表的单行连接

IM试图在AWS胶水 表1中加入两个数据集(别名AF): ID 数据 创建 1 字符串1 2020-02-10 2 字符串2 2020-02-11 3 字符串3 2020-02-12 表2(别名MP): …

深居我梦 2025-01-21 07:30:01 2 0
更多

推荐作者

alipaysp_snBf0MSZIv

文章 0 评论 0

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文