hive

hive

文章 63 浏览 53

Hbase和Hive集成有什么好处

最近看到一篇博客,作者提到了Hbase和Hive的集成。这是否可能,如果可以的话,使用两者的优势是什么(在性能和可扩展性方面)。如果我错了,请纠正我…

空宴 2024-10-10 12:59:31 0 0

我应该如何对 s3 中的数据进行分区以便与 hadoop hive 一起使用?

我有一个 s3 存储桶,其中包含约 300GB 的日志文件(无特定顺序)。 我想使用日期时间戳对这些数据进行分区,以便在 hadoop-hive 中使用,以便与特定…

时光无声 2024-10-07 18:56:53 1 0

Hive 有字符串分割功能吗?

我正在寻找 Hive 中内置的字符串分割函数?例如,如果 String 是: A|B|C|D|E 那么我想要一个像这样的函数: array&ltstring&gt split(string input, …

迷爱 2024-09-30 01:10:31 0 0

在 Hive 上编写使用外部 java 类的自定义函数

我一直在想如何在 Hive 中做到这一点。 例如,我想在日志文件中提取一个特定字段(这在 Hive 中已经可以实现),然后我想将该字段的值映射到其他内容…

就此别过 2024-09-29 10:47:45 0 0

将 Hive 与 Pig 一起使用

我的配置单元查询有多个外部联接,并且需要很长时间才能执行。我想知道将其分解为多个较小的查询并使用 Pig 来进行转换是否有意义。 有没有办法可以在…

鲜血染红嫁衣 2024-09-25 04:48:30 1 0

将多行合并为一个空格分隔的字符串

所以我有 5 行像这样 userid, col -------------- 1, a 1, b 2, c 2, d 3, e 我将如何进行查询,所以它看起来像这样 userid, combined 1, a b 2, c d …

儭儭莪哋寶赑 2024-09-19 11:50:08 3 0

如何从.NET 连接到 Hadoop/Hive

我正在开发一个解决方案,其中我将有一个运行 Hive 的 Hadoop 集群,并且我想从 .NET 应用程序发送作业和 Hive 查询进行处理,并在完成时收到通知。除…

泪冰清 2024-09-14 12:21:27 6 0

Spring-Batch 用于大规模夜间/每小时 Hive/MySQL 数据处理

我正在考虑替换一堆 Python ETL 脚本,这些脚本对大量数据执行每晚/每小时的数据摘要和统计收集。 我想要实现的是 鲁棒性 - 失败的作业/步骤应该自动…

盗琴音 2024-09-14 05:34:29 1 0

Pig 和 Hive 之间的区别?为什么两者都有?

Closed. This question is opinion-based. It is not currently accepting answers. 想要改进这个问题?更新问题,以便可以通过编辑这篇文章用事实和…

伊面 2024-09-11 19:48:13 4 0

甚至hadoop/hive上的数据分布

我正在尝试使用 2 台机器进行小型 hadoop 设置(用于实验)。我正在使用 Hive 加载大约 13GB 的数据,一个包含大约 3900 万行的表,复制因子为 1。 我…

一抹微笑 2024-09-08 07:50:52 3 0

如何在 Amazon Elastic Mapreduce 之上使用 Hive 来处理 Amazon Simple DB 中的数据?

我在 Amazon Simple DB 域中有大量数据。我想在 Elastic Map Reduce(在 hadoop 之上)上启动 Hive,并以某种方式从 simpledb 导入数据,或者连接到 s…

千仐 2024-09-07 06:27:20 3 0

使用 Hadoop,我的减速器是否能保证获得具有相同键的所有记录?

我正在使用 Hive 运行 Hadoop 作业,实际上它应该是许多文本文件中的 uniq 行。在reduce步骤中,它为每个键选择最近带时间戳的记录。 Hadoop是否保证…

七婞 2024-08-28 23:07:09 6 0

如何在 Java 中对 Hive 进行异步调用?

我想以异步方式在服务器上执行 Hive 查询。 Hive 查询可能需要很长时间才能完成,因此我不想阻止调用。我目前正在使用 Thirft 进行阻塞调用(在 clien…

蓦然回首 2024-08-20 10:14:42 4 0

构建 Apache Hive - 无法解决依赖关系

我正在按照 http://wiki.apache.org/hadoop/Hive 尝试 Apache Hive /GettingStarted 并从 Ivy 收到此错误: Downloaded file size doesn't match expe…

无人接听 2024-08-10 09:55:36 5 0

BigTable可以做OLAP吗?

过去,我曾经使用在 MySQL 上运行的 OLAP 多维数据集来构建 WebAnalytics。 现在,我使用的 OLAP 多维数据集只是一个大表(好吧,它的存储方式比这更…

横笛休吹塞上声 2024-08-04 22:25:04 6 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文