AWS ETL胶水工作

发布于 2025-01-26 10:21:28 字数 1308 浏览 2 评论 0原文

使用胶水ETL作业希望创建数据目录表和加载对象（如下所示）中的S3（分区）。表将是'data1's3

：//test/data1/2022/03/22/1.csv s3：//test/data1/2022/03/23/2.csv s3：//test/data1/2022/04/08/1.csv s3：//test/data1/2022/04/09/2.csv

s3bucket_node1 = gluecontext.create_dynamic_frame.from_options（ format_options = {“ quodechar”：'“”，“ withheader”：false，“ saparator”：“”，“”}， Connection_Type =“ S3”，格式=“ CSV”， Connection_options = { “路径”：[S3：// test/data1”]， “ recurse”：是的， }，， transformation_ctx =“ s3bucket_node1”，）
applymapping_node2 = applymapping.apply（ frame = s3bucket_node1，mappings = []，transformation_ctx =“ applymapping_node2”）
datacatalogtable_node3 = glueContext.write_dynamic_frame.from_catalog（帧= applymapping_node2，数据库=“默认”， table_name =“ data1”，附加_options = { “ enableupdatecatalog”：是的， “ UpdateBehavior”：“ Update_in_database”， “ PartitionKeys”：[“ partition_0”，“ partition_1”，“ partition_2”]， }，， transformation_ctx =“ dataCatalogtable_node3”，）*

py4j.protocol.py4jjavaerror：调用o81.getCatalogSink时发生了错误。：com.amazonaws.services.glue.model.entitynotfoundexception：table pk_datacdr_new找不到。（服务：AWSGLUE；状态代码：400;错误代码：EntityNotFoundException;请求ID：07A1EC53-2ADE-4B9F-A23F-36564DDE19D8; PROXY：NULL：NULL）

ETL GLUE工作失败，存在。有没有办法创建表，如果不存在，请告诉我？

原文