hive

hive

文章 63 浏览 55

Hive 中特定列的区别

我正在运行 Hive 071 我有一个表,包含多行,具有相同的列值,例如 | x| y | | 1 | 2 | | 1 | 3 | | 1 | 4 | | 2 | 2 | | 3 | 2 | | 3 | 1 | 我想让 x…

盗梦空间 2024-12-04 11:21:27 3 0

Hive 中特定列的区别

我正在运行 Hive 071。 我有一个表,有多行,具有相同的列值。 x | y | --------- 1 | 2 | 1 | 3 | 1 | 4 | 2 | 2 | 3 | 2 | 3 | 1 | 我想让 x 列唯一…

红尘作伴 2024-12-04 08:18:24 2 0

我的Hive-UDF怎么了?如何设置hive的map号?

我使用Hadoop-Hive来分析apache日志来统计访问特征。我写了一个名为GetCity的UDF来将remote_ip转换为城市名称,但是当我运行“select GetCity(remote_…

三生一梦 2024-12-03 12:04:52 3 0

Hadoop Hive DOUBLE 类型问题

来自新用户的快速 Hive/Hadoop 问题。 我有一个 DOUBLE 列,其值为“1.8E8”,这是否意味着我达到了 DOUBLE 的最大值? …

烦人精 2024-12-03 05:53:14 1 0

蜂巢正则表达式提取

我使用 regexp_extract() 来从字符串中提取子字符串。 一种类型的子字符串如下所示:Abc-Def-ghi 我使用 regexp_extract(s, '^[a-zA-Z0-9]{1,}\-[a-zA…

好多鱼好多余 2024-12-01 23:04:23 1 0

如何将unix纪元时间转换为hive中的日期字符串

我有一个包含时间戳列的日志文件。时间戳采用 unix 纪元时间格式。 我想根据时间戳创建一个分区,其中包含年、月和日分区。 到目前为止,我已经做到了…

柠檬色的秋千 2024-12-01 22:12:11 3 0

hive 中是否有任何函数可以将纪元时间转换为标准日期?

to_date 函数将此“1970-11-01 00:00:00”作为输入并返回“1970-11-01”。 但我有纪元时间作为输入。如何将其转换为标准日期格式? 有一个函数可以将…

哆兒滾 2024-12-01 13:20:00 4 0

多卷&使用 Hadoop 限制磁盘使用

我正在使用 Hadoop 来处理大量数据。我设置了一个hadoop节点来使用多个卷:其中一个卷是具有10To磁盘的NAS,另一个是存储容量为400 GB的服务器本地磁…

相对绾红妆 2024-12-01 02:10:34 1 0

忽略 Apache Hive 中外部表中的子目录

Hive 是否有设置或方法强制它在查询外部表时忽略子目录?我的表文件夹中有一个子目录,它不属于表数据的一部分,我想避免删除它或将文件复制到其他地…

娇柔作态 2024-11-30 16:58:33 2 0

嵌入式轻快?是否可以?

我刚刚开始使用新的应用程序,并决定尝试/学习 Cassandra 并将其用于后端。 我已经嵌入了 Cassandra,工作得非常顺利。现在我想在上面添加 Hive。以前…

泪是无色的血 2024-11-30 16:19:43 1 0

使用 unix sort、uniq 和 awk 替换 SQL 查询

目前,我们在 HDFS 集群上有一些数据,我们在这些数据上使用 Hive 生成​​报告。基础设施正在退役,我们剩下的任务是提出生成数据报告的替代方案(我…

匿名的好友 2024-11-30 02:38:13 2 0

Sqoop 命令 --hive-import 失败

我尝试使用 Hadoop 将数据库从 mysql 导入到 Hive,并使用 Sqoop 的“--hive-import”命令自动创建表并将数据加载到 hive。 我使用下面的命令使用 sqo…

玻璃人 2024-11-29 03:40:51 1 0

Hive 开箱即用的 json 解析器

我有一个包含 json 记录的文本文件,我想加载到 Hive。我的 json 看起来像: {"vr":1,"tm":1312816191516,"tms":"08-08-2011 15:09:51.516 GMT","as":…

遗失的美好 2024-11-28 21:22:33 1 0

使用 Hadoop Hive 从 OLTP Mysql 制作 OLAP

我对 Hadoop hive 有点困惑,我从 Wiki 上读到它用于制作 OLAP。 现在我想从使用 Mysql 的 OLTP 数据库在 Hive 上进行 OLAP。 我该如何解决这个问题?…

残龙傲雪 2024-11-28 12:49:46 1 0

理论上在 Hive 中可以实现并置连接 (a-la-netezza) 吗?

当您连接分布在同一键上的表并在连接条件中使用这些键列时,netezza 中的每个 SPU(机器)将 100% 独立于其他设备工作(请参阅 nz-interview)。 在 h…

若言繁花未落 2024-11-28 04:51:42 1 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文