当前位置：文江博客话题详情

使用存储过程控制所有数据流的海量表的优缺点

发布于 2024-07-24 09:46:29 字数 559 浏览 2 评论 0原文

DBA（仅用了 2 年的 google 培训）创建了一个庞大的数据管理表（108 列并且还在不断增长），其中包含系统中任何数据流的所有必要属性。我们将该表简称为 BFT。

这些列中：
10 用于元数据引用。
15 个用于数据源和时间跟踪
1 个文本数据的 new/curr 列实例
用于多值数字更新的新/当前/增量/比率/范围列的 10 个实例：总共 50 列。

多值数值更新通常只需要2-5个更新组。

批量的 15K-1500K 记录被加载到 BFT 中，并由存储过程进行处理，并使用逻辑来验证这些记录，将它们洗牌到大约 30 个其他表中的永久存储中。

在大多数记录加载中，整个过程中有 50-70 列是空的。

我不是数据库专家，但这个模型和过程似乎有点味道，但我不知道足以说出原因，并且不想在无法提供替代方案的情况下抱怨。

鉴于对数据处理模型的这种非常小的了解，有人有想法或建议吗？是否可以信任数据库（SQL Server）有效地处理大部分为空列的记录，或者以这种方式进行处理会浪费大量周期/内存等？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

眼眸印温柔 2024-07-31 09:46:29

听起来他重新发明了 BizTalk。

回复收藏 0 原文

恬淡成诗 2024-07-31 09:46:29

我通常有多个与输入负载相对应的暂存表。这些可能与目标表相对应，也可能不相对应，但我们不会执行您所说的操作。如果他不喜欢有很多基本上是临时工作表的东西，可以将它们放入自己的模式中，甚至放入单独的数据库中。

就空列而言，如果在处理 BFT 的特定查询中没有引用它们，那并不重要 - 然而，将会发生的情况是，索引变得更加重要，因为所选索引是非索引聚集覆盖索引。当使用 BFT 并选择表扫描或聚集索引扫描时，必须读取未使用的列并忽略或跳过，根据我的经验，这似乎肯定会影响处理。而使用非聚集索引扫描或查找时，读取的列较少，并且希望这不包括任何未使用的列。

回复收藏 0 原文