使用AWS胶创建雅典娜S3中存储的镶木质数据表

发布于 2025-02-07 01:34:24 字数 365 浏览 1 评论 0原文

我想在S3存储桶中预览Athena数据。数据在镶木中。此doc 在这里描述如何描述如何描述使用AWS胶水创建预览。这里的一个强制性步骤是输入列详细信息。这包括输入列名及其数据类型。我在此步骤中有两个问题:

1-如果我对镶木quet文件中存在哪些列有什么想法(即,我以前从未看过镶木木的内容)?

2-如果其中有数百个(如果不是数千列),该怎么办。

有没有办法在不输入此列详细信息的情况下进行此工作?

I want to preview in Athena data that resides in an S3 bucket. The data is in parquet. This doc here describes the process of how to use AWS Glue to create a preview. One mandatory step here is to input the Column Details. This include entering the column name and its data type. I have two problems with this step:

1 - What if I have no ideas of what columns exist in the parquet file before hand (i.e. I have not seen the content of the parquet before)?

2 - What if there are hundreds if not thousands of columns in there.

Is there a way to make the this work without entering this Column Details ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

孤单情人 2025-02-14 01:34:24

我认为,您提供的链接回答了您的第一个问题:

如果我对镶木quet文件中存在哪些列有任何想法,该怎么办

,那么您应该使用胶水搜索文件并为您创建胶水表,该怎么办。该表将在AWSDataCatalog目录中显示为可查询的关系。

如果其中有数百个(如果不是数千列),该怎么办。

如果您担心某些列配额限制,我花了一些时间来查看文档,以查看是否有每个表最大列的服务配额。我找不到任何。这并不意味着没有一个,但是我会惊讶地看到某人生成了一个比胶水支撑的列的木板文件。

The link you provided answers your first question, I think:

What if I have no ideas of what columns exist in the parquet file before hand

Then you should use a Glue crawler to explore the files and have it create a Glue table for you. That table will show up in the AwsDataCatalog catalog as a queryable relation.

What if there are hundreds if not thousands of columns in there.

If you're worried about some column quota limitation, I spent some time looking around documentation to see if there is any mention of a service quota for max columns per table. I could not find any. That doesn't mean that there isn't one, but I would be surprised to see that someone generated a parquet file with more columns than Glue supports.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文