如何在不指定红移中指定列的情况下创建外部表?
我有一个包含镶木格式的文件的文件夹。我使用Crawler创建了胶水数据目录中定义的表,该表数计算为2500多列。我想用红移在其顶部创建外部表。
但是我阅读的所有文章都明确提到了这些列。 有什么方法是为了使表直接从数据目录中的表中读取模式,而我不必单独喂食它?
I have a folder containing files in parquet format. I used crawler to create table defined in Glue Data Catalog which counted to 2500+ columns. I want to create External Table on top of it in redshift.
But all the articles that I read have mentioned the columns explicitly.
Is there any way so that the Table reads schema directly from the table in data catalog and I don't have to feed it separately?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您可以创建外部架构在基于数据目录的红移中。这样,您将在数据目录中看到所有表,而无需在红移中创建它们。
在文档中的上面示例中,
spectrum_db
是您的数据目录的名称。You can create an external schema in Redshift which is based on a data catalog. This way, you will see all tables in the data catalog without creating them in Redshift.
In the above example from the documentation,
spectrum_db
is the name of your data catalog.