SQL 2005：键、索引和约束问题

发布于 2024-08-04 12:43:35 字数 574 浏览 5 评论 0原文

我有一系列关于 SQL（尤其是 SQL 2005）中的键、索引和约束的问题。我已经使用 SQL 大约 4 年了，但我从未能够获得关于这个主题的明确答案，并且博客文章等中总是存在矛盾的信息。我创建和使用的大多数时间表只有一个 Identity 列是主键，其他表通过外键指向它。

对于连接表，我没有身份并在外键列上创建复合主键。以下是我目前信念的一组陈述，可能有错误，如有错误请指正，以及其他问题。

所以这里是：

据我了解，聚集索引和非聚集索引（无论它是否唯一）之间的区别在于，聚集索引影响表中数据的物理顺序（因此，一个表中只能有一个）表），而非聚集索引构建树形数据结构。创建索引时为什么要关心聚集索引和非聚集索引？我什么时候应该使用其中之一？有人告诉我，非聚集索引的插入和删除速度很慢，因为需要“重建”树。我认为聚集索引不会以这种方式影响性能吗？

我看到主键实际上只是唯一的聚集索引（它们必须聚集吗？）。主键与聚集唯一索引有什么特别之处？

我也见过约束，但我从未使用过它们或真正看过它们。有人告诉我，约束的目的是为了增强数据完整性，而索引的目的是为了性能。我还读到约束实际上是作为索引实现的，所以它们是“相同的”。这对我来说听起来不对。约束与索引有何不同？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

感性不性感 2024-08-11 12:43:35

聚集索引，正如您所说的那样，定义为表中的数据如何物理存储，即您有一个使用聚类键排序的 B 树，并且您在叶级别拥有数据。

另一方面，非聚集索引是单独的树结构，在叶级别仅具有聚集键（如果表是堆，则为 RID），这意味着当您使用非聚集索引时，您必须使用聚集索引来获取其他索引列（除非您的请求完全被非聚集索引覆盖，如果您仅请求构成非聚集索引键列的列，则可能会发生这种情况）。

什么时候应该使用其中之一？好吧，既然你只能有一个聚集索引，那么就在最有意义的列上定义它，即当你大多数时候通过 ID 查找客户端时，在 ID 上定义一个聚集索引。非聚集索引应该定义在不经常使用的列上。

关于性能，更改索引键的插入或更新总是很痛苦，无论它是否是非聚集索引上的聚集，因为可能会发生页面拆分，这会迫使数据在页面之间移动（移动聚集索引的页面）伤害更大，因为叶级别有更多数据）。因此，一般规则是避免更改索引键和插入新值，以便它们是连续的。否则，您将遇到碎片，并且必须定期重建索引。

最后，关于约束，根据定义，它们与索引无关，但SQL Server选择使用索引来实现它们。例如，目前，唯一约束被实现为索引，但是这可能在未来版本中发生变化（尽管我怀疑这会发生）。索引的类型（聚集或非聚集）由您决定，只要记住您只能有一个聚集索引。

如果您有更多此类问题，我强烈建议您阅读这本书，其中深入涵盖了这些主题。

回复收藏 0 原文

北方的巷 2024-08-11 12:43:35

您对集群与非集群的假设非常好

似乎主键强制执行非空唯一性，而唯一索引不强制执行非空主要与唯一

回复收藏 0 原文

錯遇了你 2024-08-11 12:43:35

主键是关系数据库理论中的一个逻辑概念 - 它是一个键（通常也是一个索引），旨在唯一标识您的任何行。因此它必须是唯一的并且不能为 NULL。

聚集键是SQL Server特有的一个存储物理概念。它是一个特殊的索引，不仅用于查找等，还定义表中数据的物理结构。在西欧文化的印刷电话簿中（冰岛可能除外），聚集索引将是“姓氏，名字”。

由于聚类索引定义了您的物理数据布局，因此您只能拥有其中之一（或没有 - 但不推荐）。

聚簇键的要求是：

必须是唯一的（如果不是，SQL Server 将添加一个 4 字节的“唯一标识符”）
应稳定（永不改变）
应尽可能小（INT 最好）
应不断增加（思考：IDENTITY）

SQL Server 默认将主键设为集群键 - 但如果需要，您可以更改它。另外，请注意：组成聚集键的列将添加到表中每个非聚集索引的每个条目中 - 因此您希望使聚集键尽可能小。这是因为聚集键将用于执行“书签查找” - 如果您在非聚集索引中找到了一个条目（例如，通过其社会安全号码找到一个人），现在您需要抓取整行数据来查找获取更多详细信息，您需要进行查找，为此，使用聚类键。

关于什么才是好的或有用的集群和/或主键存在着激烈的争论 - 这里有一些优秀的博客文章可供阅读：

Marc

回复收藏 0 原文

战皆罪 2024-08-11 12:43:35

你有几个问题。我将分解其中的一些：

创建索引时为什么我应该关心聚集与非聚集？

有时您确实关心行的组织方式。这取决于您的数据以及您将如何使用它。例如，如果您的主键是uniqueidentifier，您可能不希望它是CLUSTERED，因为 GUID 值本质上是随机的。这将导致 SQL 在整个表中随机插入行，从而导致页拆分，从而损害性能。如果您的主键值始终按顺序递增（例如 int IDENTITY），那么您可能希望它是CLUSTERED，因此您的表将始终在末尾增长。

默认情况下，主键是CLUSTERED，大多数时候您不必担心它。

有人告诉我，非聚集索引的插入和删除速度很慢，因为需要“重建”树。我认为聚集索引不会以这种方式影响性能？

实际上，事实可能恰恰相反。 NONCLUSTERED 索引保留为单独的数据结构，但该结构的设计允许进行一些修改，而无需“重新构建”。最初创建索引时，您可以指定FILLFACTOR，它指定索引的每个页面上保留多少可用空间。这允许索引在需要进行页面分割之前容忍一些修改。即使必须发生页面拆分，它也只会影响相邻页面，而不影响整个索引。

同样的行为也适用于 CLUSTERED 索引，但由于 CLUSTERED 索引存储实际的表数据，索引上的分页操作可能会更加昂贵，因为整行可能需要被移动（与仅键列和 NONCLUSTERED 索引中的 ROWID 相比）。

以下 MSDN 页面讨论了 FILLFACTOR 和页面拆分：
http://msdn.microsoft.com/en-us /library/aa933139(SQL.80).aspx

主键与聚集唯一索引有何特别之处？
约束与索引有何不同？

对于这两者，我认为更多的是声明您的意图。当您将某些内容称为PRIMARY KEY时，您就声明它是识别给定行的主要方法。 主键在物理上与聚集唯一索引不同吗？我不知道。行为本质上是相同的，但使用您的数据库的人可能不清楚您的意图。

关于约束，约束有很多种。对于 UNIQUE CONSTRAINT 来说，除了声明您的意图之外，它与 UNIQUE INDEX 之间没有真正的区别。还有其他类型的约束不直接映射到索引类型，例如 CHECK 约束、DEFAULT 约束和 FOREIGN KEY 约束。

You have several questions. I'll break some of them out:

When creating Indexes why should I care about Clustered vs Non Clustered?

Sometimes you do care how the rows are organized. It depends on your data and how you will use it. For example, if your primary key is a uniqueidentifier, you may not want it to be CLUSTERED, because GUID values are essentially random. This will cause SQL to insert rows randomly throughout the table, causing page splits which hurt performance. If your primary key value will always increment sequentially (int IDENTITY for example), then you probably want it to be CLUSTERED, so your table will always grow at the end.

A primary key is CLUSTERED by default, and most of the time you don't have to worry about it.

I was told that inserting and deleting are slow with Non-Clustered indexes as the tree needs to be "rebuilt." I take it Clustered indexes do not affect performance this way?

Actually, the opposite can be true. NONCLUSTERED indexes are kept as a separate data structure, but the structure is designed to allow some modification without needing to be "re-built". When the index is initially created, you can specify the FILLFACTOR, which specifies how much free space to leave on each page of the index. This allows the index to tolerate some modification before a page split is necessary. Even when a page split must occur, it only affects the neighboring pages, not the entire index.

The same behavior applies to CLUSTERED indexes, but since CLUSTERED indexes store the actual table data, page splitting operations on the index can be much more expensive because the whole row may need to be moved (versus just the key columns and the ROWID in a NONCLUSTERED index).

The following MSDN page talks about FILLFACTOR and page splits:
http://msdn.microsoft.com/en-us/library/aa933139(SQL.80).aspx

What is special about a Primary Key vs a Clustered Unique Index?
How are constraints different to Indexes?

For both of these I think it's more about declaring your intentions. When you call something a PRIMARY KEY you are declaring that it is the primary method for identifying a given row. Is a PRIMARY KEY physically different from a CLUSTERED UNIQUE INDEX? I'm not sure. The behavior is essentially the same, but your intentions may not be clear to someone working with your database.

Regarding constraints, there are many types of constraints. For a UNIQUE CONSTRAINT, there isn't really a difference between that and a UNIQUE INDEX, other than declaring your intention. There are other types of constraints that do not map directly to a type of index, such as CHECK constraints, DEFAULT constraints, and FOREIGN KEY constraints.

回复收藏 0 原文