aws-glue

aws-glue

文章 0 浏览 2

无法通过胶水连接到红移

RedShift群集在公共子网中(公共可访问性已经启用),我正在尝试添加胶水连接。安全组和IAM角色已经到位,但是我面临的错误“找不到S3端点或NAT网关”…

时光无声 2025-01-26 06:56:27 2 0

雅典娜在更新胶水数据目录中更新架构后仍指旧模式

我有一个JSON文件,该文件在字段名称中具有空格。胶水轨道能够在结构中推断并适当地创建字段。但是,当我在雅典娜询问这张桌子时,我会得到hive_metas…

清旖 2025-01-26 04:45:48 1 0

AWS胶Redshift_tmp_dir尺寸生长

据我了解,将数据推向红移时,胶水将数据写入“ Temp” S3位置,然后从那里使用Redshift的副本。 我最近扫描了我们的S3存储桶,并注意到我们的一项工…

虐人心 2025-01-25 13:32:12 0 0

从AWS CLI中的本地文件加载参数

我正在尝试从AWS CLI创建胶水工作。当我在中使用实际的胶合作业名称 - 名称字段时,它可以 aws glue create-job \ --name my-first-glue-job-cli \ --…

眼眸印温柔 2025-01-25 06:45:37 1 0

日志组和日志流名称问题AWS胶

我的帐户中有一个胶水作业,并且多次运行它,并且相应的日志在云手表中的AWS/ AWSGLUE/日志流中可用。但是还有其他开发人员还在开发胶水作业,这使我…

窝囊感情。 2025-01-25 05:02:49 2 0

Pyspark使用Pivot的用户保留量不同

我正在尝试使用Pyspark创建一个用户保留表,我可以将其转移到AWS胶水中,以创建一个可以在快速观察的ETL作业中查询的ETL作业。 基本上,我有两个表,…

ゃ懵逼小萝莉 2025-01-24 20:33:45 5 0

如何优化S3的阅读?

dyf_pagewise_word_count = glueContext.create_dynamic_frame.from_options( connection_type="s3", format="csv", connection_options={ "paths": …

自由范儿 2025-01-24 18:41:10 5 0

显示VSS代码远程资源管理器需要什么

我正在尝试使用VSS代码作为源代码控制器设置本地胶水环境。 我遵循链接中给出的说明 https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programmi…

爱的故事 2025-01-24 14:59:53 2 0

AWS GLUE create_partition使用boto3成功,但雅典娜没有显示查询结果

我有一个使用Create_Partition()创建新分区的胶水脚本。胶水脚本正在成功运行,使用节目分区时,我可以在雅典娜控制台中看到分区。对于粘合脚本crea…

弄潮 2025-01-24 13:36:43 6 0

使用Pyspark处理大量小型JSON文件

我在的 376K json 文件中有 s3 的目录下的文件。这些文件是 2.5 kb 每个文件,仅包含一个记录/文件。当我尝试通过以下代码通过胶水ETL 使用 20工人: …

梦魇绽荼蘼 2025-01-24 04:40:46 2 0

SecretsManager动态参考是否可在胶水云形象中起作用?

我试图 ({{resolve:secretsmanager:${DBSecretManagerArn}:SecretString:username}}) 在构建过程中使用Secret Manager Dynamion参考在胶水云形式中创…

廻憶裏菂餘溫 2025-01-24 02:26:18 5 0

胶水秘密经理集成:未提供SecretID

我使用GlueEtl库从本地计算机运行胶水板脚本。 从Glue目录创建数据框时, dyf_user_book_reading_stat = glueContext.create_dynamic_frame.from_cata…

妄司 2025-01-24 01:55:51 5 0

使用Docker-Compose本地运行胶水容器

我想使用此命令 $ docker run -It -v〜/.aws:/home/glue_user/.aws -e aws_profile = $ profile_name -e disable_ssl = true -rm -p 4040:4040 -p 1…

偷得浮生 2025-01-23 15:42:31 5 0

如何通过使用胶作业使用Python将CloudWatch日志导出到S3?

我在粘合作业脚本中运行一个代码,在运行一些日志后,我需要通过使用GlueJob中的Python代码来存储S3存储桶的那些日志。是否可以。…

烟柳画桥 2025-01-23 14:47:54 3 0

AWS雅典娜:带有非标准文件结构的S3存储桶的分区表

我是雅典娜的新手,我很难了解分区的工作原理以及它是否可以对我有用。 我以以下格式有S3中的文件: path/to/files/yyyymmddthhmmsssz_< id> …

笛声青案梦长安 2025-01-23 08:16:53 3 0
更多

推荐作者

alipaysp_snBf0MSZIv

文章 0 评论 0

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文