hive

hive

文章 63 浏览 55

如何在 Apache Hive 中并行化(小)数据集的查询

我正在我的部分数据集上测试最新的 Hive。我通过自定义 SerDe 读取的日志文件只有几 GB。 当我运行简单的 Group By 查询(4 个 MR 作业)时,我收到诸…

各自安好 2024-10-19 08:59:17 3 0

Apache Hive 中的自动化测试

我即将开始一个使用 Apache Hadoop/Hive 的项目,该项目将涉及一组 hive 查询脚本,以便为各种下游应用程序生成数据源。这些脚本似乎是某些单元测试的…

醉生梦死 2024-10-19 03:40:02 4 0

Hive 在 HDFS 中的什么位置存储文件?

我想知道如何找到 Hive 表和它们所代表的实际 HDFS 文件(或更确切地说,目录)之间的映射。我需要直接访问表文件。 Hive 将其文件存储在 HDFS 中的什…

千笙结 2024-10-18 10:03:51 6 0

向现有 HIVE 表添加列会产生什么后果?

假设在开始使用 HIVE 后,我想添加一个列。 来自各种文章和我看过的页面,我无法理解所需 存储空间(双?) 阻塞(我仍然可以在其他进程中读取该表)…

忘年祭陌 2024-10-18 04:13:14 3 0

Hive、hadoop 以及 hive.exec.reducers.max 背后的机制

在其他问题的背景下 这里 使用 hive.exec.reducers.max 指令确实让我感到困惑。 从我的角度来看,我认为 hive 致力于某种逻辑,例如,我在所需的查询…

海拔太高太耀眼 2024-10-17 13:34:57 3 0

Hive 与 Lucene

是否可以使用 Hive 查询分布在 Hadoop 上的 Lucene 索引???…

药祭#氼 2024-10-15 05:05:20 4 0

为 Hive 中的 INSERT OVERWRITE SELECT 指定压缩编解码器

我有一个像 To populate 这样的配置单元表 CREATE TABLE beacons ( foo string, bar string, foonotbar string ) COMMENT "Digest of daily beacons, …

美羊羊 2024-10-14 22:56:41 3 0

Hive QL 是否具有与直接在 Hadoop 上编写自己的 MapReduce 作业相同的表达能力?

换句话说, 是否有一个问题可以通过直接定义 MapReduce 作业来解决,但无法形成 Hive QL 查询? 如果是,则意味着 Hive QL 的表达能力有限,无法表达…

病毒体 2024-10-14 20:02:06 4 0

如何将mysql表传输到hive?

我有一个大型 mysql 表,我想将其转移到 Hadoop/Hive 表。是否有标准命令或技术将简单(但大)的表从 Mysql 传输到 Hive?该表主要存储分析数据。…

戴着白色围巾的女孩 2024-10-11 10:02:47 3 0

Hbase和Hive集成有什么好处

最近看到一篇博客,作者提到了Hbase和Hive的集成。这是否可能,如果可以的话,使用两者的优势是什么(在性能和可扩展性方面)。如果我错了,请纠正我…

空宴 2024-10-10 12:59:31 5 0

我应该如何对 s3 中的数据进行分区以便与 hadoop hive 一起使用?

我有一个 s3 存储桶,其中包含约 300GB 的日志文件(无特定顺序)。 我想使用日期时间戳对这些数据进行分区,以便在 hadoop-hive 中使用,以便与特定…

时光无声 2024-10-07 18:56:53 4 0

Hive 有字符串分割功能吗?

我正在寻找 Hive 中内置的字符串分割函数?例如,如果 String 是: A|B|C|D|E 那么我想要一个像这样的函数: array split(string input, char delimit…

迷爱 2024-09-30 01:10:31 7 0

在 Hive 上编写使用外部 java 类的自定义函数

我一直在想如何在 Hive 中做到这一点。 例如,我想在日志文件中提取一个特定字段(这在 Hive 中已经可以实现),然后我想将该字段的值映射到其他内容…

就此别过 2024-09-29 10:47:45 5 0

将 Hive 与 Pig 一起使用

我的配置单元查询有多个外部联接,并且需要很长时间才能执行。我想知道将其分解为多个较小的查询并使用 Pig 来进行转换是否有意义。 有没有办法可以在…

鲜血染红嫁衣 2024-09-25 04:48:30 6 0

将多行合并为一个空格分隔的字符串

所以我有 5 行像这样 userid, col -------------- 1, a 1, b 2, c 2, d 3, e 我将如何进行查询,所以它看起来像这样 userid, combined 1, a b 2, c d …

儭儭莪哋寶赑 2024-09-19 11:50:08 6 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文