当前位置：文江博客话题详情

SQL Server：批量加载的唯一键

发布于 2024-09-08 06:06:35 字数 316 浏览 7 评论 0原文

我正在开发一个数据仓库项目，其中多个系统将数据加载到暂存区域以进行后续处理。每个表都有一个“loadId”列，它是“loads”表的外键，其中包含加载时间、用户帐户等信息。

目前，源系统调用存储过程来获取新的loadId，将 loadId 添加到将插入的每一行，然后调用第三个存储过程来指示加载已完成。

我的问题是，有什么方法可以避免将 loadId 传回源系统吗？例如，我想象我可以从 Sql Server 获取某种连接 ID，我可以用它来查找负载表中的相关 loadId。但我不确定Sql Server是否有一个连接特有的变量？

有谁知道吗？

谢谢，

需要登录才能够评论，你可以免费注册一个本站的账号。

向地狱狂奔 2024-09-15 06:06:35

我假设源系统正在将插入写入/提交到源表中，并且多个加载不会同时运行...

如果是这样，请在开始加载之前让源加载调用存储过程 newLoadStarting()程序。此存储过程将更新加载表（创建新行，记录开始时间）

在 loadID 列上放置一个触发器，该触发器将从该表获取 max(loadID) 并插入为当前加载 id。

为了完整起见，您可以添加一个 endLoading() 过程，它设置结束日期并取消激活该特定加载。

如果您在同一个表中同时运行多个加载...停止这样做...这不是很有效率。

白云不回头 2024-09-15 06:06:35

本地临时表（带有一个井号#temp）对于会话来说是唯一的，将 ID 转储到其中然后从中选择

顺便说一句，这仅在您使用相同连接时才有效

怀中猫帐中妖 2024-09-15 06:06:35

最后，我采用了以下解决方案“模式”，与 Markus 的建议非常相似：

我创建了一个带有 loadId 列的表，默认为 null（加上一些其他审核信息，如createdDate 和createdByUser）；
我在表上创建了一个视图，隐藏了loadId和audit列，只显示loadId为null的行；
源系统将数据加载/查看到视图中，而不是表中；
完成后，源系统调用“sp__loadFinished”过程，该过程将正确的值放入 loadId 列中并执行一些其他日志记录（接收的行数、调用的日期等）。我从模板生成它，因为它是重复的。

由于 loadId 现在具有所有这些行的值，因此它对源系统不再可见，并且可以在需要时启动另一个加载。

我还安排每个源系统都有自己的架构，这是它唯一可以看到的东西，也是登录时的默认值。视图和存储过程位于此模式中，但基础表位于包含所有源数据的“暂存”模式中。我通过命名约定确保不存在冲突。

工作起来就像一个魅力，包括只有更新了两个表才能完成加载的一个情况。