数据库集成测试的可维护性

发布于 2024-10-14 17:07:18 字数 740 浏览 4 评论 0原文

我正在开发一种 ETL 流程，用于将业务数据从一个数据库提取到数据仓库。该应用程序未使用 NHibinate、Linq to Sql 或实体框架。应用程序有自己生成的数据访问类，这些类生成执行 CUID 所需的 SQL 语句。

可以想象，编写生成自定义 SQL 的代码的开发人员很容易犯错误。

我想编写一个程序来生成测试数据（Arrange），然后执行 ETL 过程（Act）并验证数据仓库（Assert）。

我认为编写这样的程序并不难。然而，我担心的是，在过去，我的公司曾尝试做类似的事情，但最终导致了一系列不可维护的单元测试，这些测试不断失败，因为随着新功能的添加，数据库模式发生了许多新的变化。

我的计划是编写一个在构建机器上运行的集成测试，而不是任何单元测试来确保 ETL 过程正常运行。由于业务逻辑决定数据如何加载到数据仓库，因此测试数据不能完全随机生成。我们有自定义开发工具，可以在数据库定义发生更改时生成新的数据访问类。

我希望社区能够提供任何反馈，帮助我编写易于维护的集成测试。我的一些想法：

我欢迎任何建议谢谢

需要登录才能够评论，你可以免费注册一个本站的账号。

飘然心甜 2024-10-21 17:07:18

嘿，德苏姆，
尽管我并不真正了解 ETL 的整个架构，但我想说，集成测试应该只是测试过程中的另一个步骤。

即使第一次遇到的单元测试结果一团糟，您也应该记住，在许多情况下，单个单元测试是最好的检查位置。或者您是否想将整个集成测试拆分为三路案例或某种东西。其他更深入的，为了保证这三个条件中的每一个的正确流动？

混乱的单元测试只是混乱的生产代码的结果。不要感到被冒犯。这只是我的意见。单元测试迫使编码人员保持干净的编码风格，并使整个事情更加可维护。

所以......我的目标是，您不仅要考虑对整个事情执行集成测试，因为单元测试（如果以正确的方式使用）可以更详细地关注问题。

问候，
MacX

混吃等死 2024-10-21 17:07:18

首先，假设我认为这是一个很好的计划，并且我已经使用 Oracle & 做了类似的事情。 PL/SQL 几年前。恕我直言，您的问题主要是组织问题，而不是技术问题：

您必须有专人负责扩展和维护测试代码。
维护测试数据的责任必须明确（并提供易于测试数据维护的机制；这同样适用于您可能需要的任何验证数据）
整个团队应该知道，只要测试失败，任何代码都不会进入生产环境。如果测试失败，团队的首要任务应该是修复它（代码或测试，无论是正确的）。训练他们只要测试失败就不要开发任何新功能！
错误修复后，修复者应该很容易验证之前失败的集成部分之后不会失败。这意味着，应该可以从任何开发人员机器（或至少是其中的一部分）快速轻松地运行整个测试。如果您的测试太大，快速可能会给 ETL 过程带来问题，因此请专注于使用尽可能少的数据来测试大量内容。也许您可以将整个测试分解为可以逐步执行的更小的部分。