当前位置：文江博客话题详情

unit-testing testing hive

Apache Hive 中的自动化测试

发布于 2024-10-19 03:40:02 字数 410 浏览 4 评论 0原文

我即将开始一个使用 Apache Hadoop/Hive 的项目，该项目将涉及一组 hive 查询脚本，以便为各种下游应用程序生成数据源。这些脚本似乎是某些单元测试的理想候选者 - 它们代表了我的数据存储和客户端应用程序之间 API 合同的履行，因此，编写给定的起始数据集的预期结果是微不足道的。我的问题是如何运行这些测试。

如果我使用 SQL 查询，我可以使用 SQLlite 或 Derby 之类的工具来快速启动测试数据库、加载测试数据并针对它们运行一组查询测试。不幸的是，我不知道 Hive 有任何此类工具。目前，我最好的想法是让测试框架启动一个 hadoop 本地实例并针对它运行 Hive，但我以前从未这样做过，而且我不确定它是否会起作用，或者是否是正确的路径。

另外，我对关于我正在做的是单元测试还是集成测试的迂腐讨论不感兴趣 - 我只需要能够证明我的代码有效。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（4）

陌伤ぢ 2024-10-26 03:40:02

Hive 有特殊的独立模式，专为测试目的而设计。在这种情况下，它可以在没有hadoop的情况下运行。我认为这正是您所需要的。
有一个文档链接：

http://wiki.apache.org/hadoop/Hive/HiveServer

回复收藏 0 原文

影子是时光的心 2024-10-26 03:40:02

我作为支持大数据和分析平台的团队的一员，我们也遇到了此类问题。

我们已经搜索了一段时间，发现了两个非常有前途的工具： https://github.com/klarna/HiveRunner https://github.com/bobfreitas/HadoopMiniCluster

HiveRunner 是一个构建在JUnit 用于测试 Hive 查询。它启动一个独立的 HiveServer，并以内存中的 HSQL 作为元存储。有了它，你可以存根表、视图、模拟样本等。

虽然 Hive 版本有一些限制，但我绝对推荐它

希望它对你有帮助 =)

回复收藏 0 原文

温柔嚣张 2024-10-26 03:40:02

您可能还需要考虑以下博客文章，其中描述了使用自定义实用程序类和 ant 进行自动化单元测试： http://dev.bizo.com/2011/04/hive-unit-testing.html

回复收藏 0 原文

故事和酒 2024-10-26 03:40:02

我知道这是一个旧线程，但以防万一有人遇到它。我已经跟进了整个迷你集群和hive 测试，发现 MR2 和 YARN 的情况发生了变化，但是是好的变化。我整理了一篇文章和 github 存储库来提供一些帮助：

http: //www.lopakalogic.com/articles/hadoop-articles/hive-testing/

希望有帮助！

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

995 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文