在数据仓库中存储缓慢变化的属性的最佳方法是什么？

发布于 2024-12-19 22:29:37 字数 548 浏览 0 评论 0原文

在经典的关系数据仓库设计中，缓慢变化的属性（不经常变化的属性）存储在具有类似于以下架构的表中：

EntityKey、StartDate、EndDate、Attribute1、Attribute2、Attribute3...

（这可能与快速变化的属性形成对比，后者可以存储为：
EntityKey、Timestamp、Attribute1、Attribute2、Attribute3...）

我不喜欢这种方法的地方是有很多重复的信息。如果属性 1 每周更改一次，而属性 2 每年仅更改一次，则最终会每周重复属性 2。如果你有很多可以加起来的属性。

当然，您可以为每个时间间隔创建一个这样的表（一个用于每周属性的表，一个用于每月属性的表，一个用于每年属性的表等），但在现实世界中，各种属性会在不同的时间点发生变化，不一定根据任何图案。此外，对于某些实体，相同的属性可能比其他实体更频繁地更改。

我很好奇是否有人对这些不经常更改但频率不同的属性的不同存储模式有建议或想法（即有些每天更改，其他每周更改等）。也许有我不知道的（非关系型）数据库技术更适合此类问题？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

悟红尘 2024-12-26 22:29:37

我不喜欢这种方法的地方是有很多重复的信息。

这就是仓库的意义所在。重复信息以表示 (a) 发生的历史事实和 (b) 减少连接数量。

如果属性 1 每周更改一次，而属性 2 每年仅更改一次，则最终会每周重复属性 2。如果你有很多可以加起来的属性。

错误的。它根本不会加起来很快。

您似乎在谈论星型模式中的维度。它们相对较小。与事实表相比，存储是无关紧要的。不要标准化或优化。将此视为“预连接”、“高速”、“非规范化”、“仅报告”表。对非标准化数据感到满意：它更快。

如果您谈论的是事实表，那么这些更改具有不同的时间粒度，并且从不应该位于同一个事实表中。

回复收藏 0 原文

~没有更多了~

关于作者

小瓶盖

暂无简介

文章

336 人气

关注发私信

燃烧我的卡路李先生

文章 0 评论 0

关注

qq_2gSKZM

文章 0 评论 0

关注

∞梦里开花

文章 0 评论 0

关注

qq_IklFPL

文章 0 评论 0

关注

迷途知返

文章 0 评论 0

关注

深海不蓝

文章 0 评论 0

友情链接

文江博客

在数据仓库中存储缓慢变化的属性的最佳方法是什么？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签