用于建模作业执行流程的设计模式

发布于 2024-12-27 03:30:26 字数 360 浏览 1 评论 0原文

在我的应用程序中，我有一组要执行的作业。每个作业都会经历“未开始”、“已开始”、“已完成”、“失败”等状态。每个作业都有一组前置条件和后置条件。在满足先决条件之前，作业无法启动，如果不满足后置条件，则应将其标记为失败。

例如，假设作业将文本文件导入数据库。前置条件是检查源文件是否存在，后置条件是检查数据库中是否存在数据。

除了这些前置和后置条件之外，有时一项工作还依赖于其他工作来完成。创建作业表并拥有作业的依赖关系表很容易，但实际上是否可以使这些验证前和验证后检查在数据库中可配置（这样，如果这些条件发生变化或添加了新条件）？即使有可能，这样做是个好主意吗？

需要使该模型通用，以便其他应用程序也可以使用它，即使要执行的验证检查对于其他应用程序完全不同。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

↙温凉少女 2025-01-03 03:30:26

我认为你冒着尝试过多驾驶的风险。通过尝试表驱动所有验证前和验证后条件，您正接近尝试在数据中编写代码的危险。

我已经构建了一些非常复杂的作业调度应用程序。其中一个可能特别令人感兴趣的是每日 ETL 流程，该流程根据平面文件源加载数十个 SQL 表。

现有系统使用线性过程，程序员必须手动计算表间依赖关系并按给定顺序运行表加载。这样做的问题是，如果任何进程失败，其余的作业就必须坐下来等待问题解决。

我构建了一个新系统，该系统具有表驱动的元数据，可以指出直接的表间依赖关系。换句话说，表 A 具有表 B 和表 C 的 FK。无需手动跟踪所有相互依赖关系，而是仅跟踪直接相互依赖关系。然后调度程序只需查看哪些加载已完成，哪些加载尚未完成。任何没有不完整依赖关系的挂起负载都可以启动。

我认为你应该类似地构建你的系统。使用关注点分离。不要表驱动依赖项是什么，而应该只表驱动存在哪些依赖项。您可以在调度表中跟踪这些依赖项中哪些已通过，哪些已失败。数据库不需要知道如何进行这些测试。让代码关心依赖项到底是什么以及如何测试它们是通过还是失败。这就是您的作业调度程序需要知道的全部内容。避免创建源代码位于数据库中的脚本语言的诱惑。