当前位置：文江博客话题详情

使用 parquet 文件在 Impala 表中进行类型转换

发布于 2025-01-09 21:11:30 字数 1066 浏览 1 评论 0原文

我在使用镶木地板文件将 Impala 的列类型从 string 更改为 int 时遇到问题。

使用：

alter table DATABASE.TABLE更改COL COL Int（从字符串到int）

或

alter table DATABASE.TABLE更改COL COL string（从int到字符串）

产生错误读取数据时：

文件 x 的“db.table.col”列具有不兼容的 Parquet 架构。列类型：INT，Parquet 模式：可选 byte_array col [i:1 d:1 r:0]

阅读此文档，我了解到：

TINYINT 到 SMALLINT/INT ：可以
SMALLINT 到 INT：可以

考虑以下因素：

列的任何其他类型转换都会产生转换错误在查询期间

这是否意味着除上述类型之外的所有类型转换都是可能的（查询通过）但在查询时会引发错误？

附加信息：

在计算统计信息（或选择）之前刷新表并不能解决问题。
更改列类型后使元数据无效也是如此。
该问题在 Hue 中或使用 python 脚本时都会出现。
我正在使用 impalad 版本 2.12.0-cdh5.16.2 RELEASE
该错误涉及第一个 parquet 文件（更新类型之前包含表内容的文件）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

七婞 2025-01-16 21:11:30

由于您正在更改数据类型（元数据），因此需要使元数据无效，以便 impala 被迫查找元数据而不是使用旧的元数据。

因此，在您的 alter 语句之后，请使用它来修复错误。 Impala 将在查询时使用最新的元数据，并且 SQL 将正常工作。

INVALIDATE METADATA mytable

Since you are changing data type( metadata), you need to invalidate metadata so that impala forced to look for metadata and not use old metadata.

So, after your alter statement pls use this to fix the error. Impala will use latest metadata while querying and SQL will work fine.

INVALIDATE METADATA mytable

回复收藏 0 原文

~没有更多了~

关于作者

始于初秋

暂无简介

文章

25 人气

关注发私信

檐前雨

文章 0 评论 0

关注

鹿港巷口少年归

文章 0 评论 0

关注

qq_32QL4xcD

文章 0 评论 0

关注

sum_

文章 0 评论 0

关注

DLL

文章 0 评论 0

关注

唐婉

文章 0 评论 0

友情链接

文江博客

使用 parquet 文件在 Impala 表中进行类型转换

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

檐前雨

鹿港巷口少年归

qq_32QL4xcD

sum_

DLL

唐婉

友情链接

使用 parquet 文件在 Impala 表中进行类型转换

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

檐前雨

鹿港巷口少年归

qq_32QL4xcD

sum_

DLL

唐婉

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。