返回介绍

Hive 数据类型 - Hive 教程

发布于 2025-02-22 13:46:38 字数 2187 浏览 0 评论 0 收藏 0

本章介绍 Hive 不同的数据类型,用于创建表。Hive 所有数据类型分为四种类型,给出如下:

  • 列类型
  • 文字
  • Null 值
  • 复杂类型

列类型

列类型被用作 Hive 的列数据类型。它们如下:

整型

整型数据可以指定使用整型数据类型,INT。当数据范围超过 INT 的范围,需要使用 BIGINT,如果数据范围比 INT 小,使用 SMALLINT。 TINYINT 比 SMALLINT 小。

下表描述了各种 INT 数据类型:

类型后缀示例
TINYINTY10Y
SMALLINTS10S
INT-10
BIGINTL10L

字符串类型

字符串类型的数据类型可以使用单引号('') 或双引号(“”) 来指定。它包含两个数据类型:VARCHAR 和 CHAR。Hive 遵循 C-类型的转义字符。

下表描述了各种 CHAR 数据类型:

数据类型长度
VARCHAR1 to 65355
CHAR255

时间戳

它支持传统的 UNIX 时间戳可选纳秒的精度。它支持的 java.sql.Timestamp 格式“YYYY-MM-DD HH:MM:SS.fffffffff”和格式“YYYY-MM-DD HH:MM:ss.ffffffffff”。

日期

DATE 值在年/月/日的格式形式描述 NaN.

小数点

在 Hive 小数类型与 Java 大十进制格式相同。它是用于表示不可改变任意精度。语法和示例如下:

DECIMAL(precision, scale)
decimal(10,0)

联合类型

联合是异类的数据类型的集合。可以使用联合创建的一个实例。语法和示例如下:

UNIONTYPE<int, double, array<string>, struct<a:int,b:string>>

{0:1} 
{1:2.0} 
{2:["three","four"]} 
{3:{"a":5,"b":"five"}} 
{2:["six","seven"]} 
{3:{"a":8,"b":"eight"}} 
{0:9} 
{1:10.0}

文字

下面是 Hive 中使用的文字中:

浮点类型

浮点类型是只不过有小数点的数字。通常,这种类型的数据组成 DOUBLE 数据类型。

十进制类型

十进制数据类型是只不过浮点值范围比 DOUBLE 数据类型更大。十进制类型的范围大约是 -10-308 到 10308.

Null 值

缺少值通过特殊值 - NULL 表示。

复杂类型

Hive 复杂数据类型如下:

数组

在 Hive 数组与在 Java 中使用的方法相同。

Syntax: ARRAY<data_type>

映射

映射在 Hive 类似于 Java 的映射。

Syntax: MAP<primitive_type, data_type>

结构体

在 Hive 结构体类似于使用复杂的数据。

Syntax: STRUCT<col_name : data_type [COMMENT col_comment], ...>

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文