当前位置：文江博客话题详情

database-design data-warehouse

对或错：好的设计要求每个表都有一个主键，如果没有别的，就是一个连续的整数

发布于 2024-08-23 15:10:48 字数 333 浏览 5 评论 0原文

考虑一个杂货店场景（我正在编造），其中您有代表销售交易的事实记录，其中事实表的列包括

SaleItemFact Table
------------------
CustomerID  
ProductID  
Price  
DistributorID  
DateOfSale  
Etc  
Etc  
Etc

即使当您考虑所有键时表中存在重复项，我也会争辩应该组成一个代理运行数字键（即标识列），例如 Integer 类型的 TransactionNumber。

我看到有人争论事实表可能没有唯一键（尽管我发明了一个并浪费了 4 个字节，但是维度表怎么样？

Consider a grocery store scenario (I'm making this up) where you have FACT records that represent a sale transaction, where the columns of the Fact table include

SaleItemFact Table
------------------
CustomerID  
ProductID  
Price  
DistributorID  
DateOfSale  
Etc  
Etc  
Etc

Even if there are duplicates in the table when you consider ALL the keys, I would contend that a surrogate running numeric key (i.e. identity column) should be made up, e.g., TransactionNumber of type Integer.

I can see someone arguing that a Fact table might not have a unique key (though I'd invent one and waste the 4 bytes, but how about a dimension table?

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

蓝礼 2024-08-30 15:10:48

第一范式要求每个表都有一个主键。所以这是良好数据库设计的最低要求。您选择的主键有很多争议。但数据库设计的第一范式却不是。

回复收藏 0 原文

烙印 2024-08-30 15:10:48

每行拥有唯一键（从数据或其他方式构建）的众多原因之一是为了方便对该特定行的更新或删除。

无论如何，这个问题有点愚蠢，因为实际上不存在工程权衡。没有钥匙并没有真正的好处，那么有什么意义呢？是的/是的，行应该有唯一的标识符。

回复收藏 0 原文

与酒说心事 2024-08-30 15:10:48

因为您的问题是在数据仓库下：

维度表应该有一个代理（无意义）主键，通常是一个自动递增整数；唯一标识表行描述的对象的业务键——例如电子邮件地址、全名或类似名称。
事实表大多数（几乎总是）有一个主键，它是两个或多个外键的组合。
事实

将外键组合到主键时，事实表中不应有重复项。要测试这一点，只需尝试加载同一事务两次 - 它应该会失败。自动生成的主键不会阻止这种情况，因为它不存在于仓库之外。通常可以通过将时间戳包含在主键中来解决该问题。

有时，事实表用作维度，或者在可充当维度的视图中使用。在这种情况下，使用一个（大）整数作为主键而不是多个 FK 字段会很方便——但是，FK 和时间戳的原始组合仍应唯一地标识事实行。

回复收藏 0 原文

夜未央樱花落 2024-08-30 15:10:48

对于数据仓库，事实表通常具有复合主键，通常是维度表的所有外键的组合。

在事实表中没有任何主键也是很常见的，因为它们通常除了浪费空间之外没有任何用途 - 对于大型数据仓库来说，空间可能非常大。不过，您的维度表将具有主键。

如果您谈论的是杂货店的 OLTP 部分，您通常会遵循标准 OLTP 数据库设计、规范化表并提供主键。

回复收藏 0 原文

夜还是长夜 2024-08-30 15:10:48

真的。从概念上思考，一切都是唯一的，即使它不是由唯一数据定义的。因此，如果您将数据输入到表中并且它们具有完全相同的信息，则它们仍然是唯一的，因为它们被输入了两次。

除此之外，您还可以获得能够以相对较低的成本（4 字节）基于 id 轻松选择、更新、删除的好处。可以说，表越大，id 就越有用。因此，表越大，4 个字节就变得越来越少:-)

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

26 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待＂谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文