重新索引大表 - 我有多糟糕？

发布于 2024-07-15 17:23:24 字数 1016 浏览 9 评论 0原文

我有一个 1 TB、600m 行的表，该表对索引列的选择存在误导，特别是主键列上的聚集索引，该索引从未在选择查询中使用。

我想从该行中删除聚集索引并在许多其他行上创建它。

目前的表如下：

colA (PK, nvarchar(3)) [聚集索引 pt b]
colB (PK, bigint) [聚集索引 pt a]
colC (DateTime) [非聚集索引]
colD (Money) [非聚集索引]
colE (位) [无索引]
colF（位）[无索引]
colG（int）[无索引]
更多非索引列

我想将其更改为如下所示：

colA (PK, nvarchar(3)) [聚集索引 pt a]
colB (PK, bigint) [非聚集索引]
colC (DateTime) [非聚集索引]
colD (Money) [聚集索引 pt d]
colE (位) [聚集索引 pt b]
colF (位) [聚集索引 pt c]
colG (int) [聚集索引 pt e]
更多非索引列

两个问题： 1）您估计此更改将需要多长时间（消息末尾的服务器规范）。不幸的是，它是一个实时数据库，如果不知道它会停机多长时间，我就无法停机。

2）向聚集索引添加这么多列是不是一个糟糕的主意？几乎从不执行更新。有许多插入和许多选择总是使用所有建议的索引行作为选择参数。

服务器规格：RAID 5 中的 5 个 15kRPM 驱动器、MS-SQL Sever 2005 以及一些保持其运行的位。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

偏爱自由 2024-07-22 17:23:24

一方面，我会避免使聚集索引比它绝对需要的更宽。把它分成五个部分似乎会适得其反。该复合聚集索引中的所有列是否稳定，例如永远不会改变？

如果没有，我会不惜一切代价避免他们。聚集索引应该是：

唯一
稳定
尽可能窄

您可以更改非聚集索引 - 没问题。但要避免让聚集索引变得混乱！这肯定会降低你的表现！

查看 Kimberly Tripp 关于索引的优秀博客文章：

Marc

回复收藏 0 原文

那一片橙海， 2024-07-22 17:23:24

我进行了更改，并且没有花太长时间。
以下是每个操作的时间，第一次是在具有单个 7200RPM 驱动器的备份服务器上运行，第二次是在 RAID 中具有 15k 驱动器的主服务器上运行。

ALTER TABLE Table DROP CONSTRAINT [PK_Table]

2:39 小时/19 分钟

CREATE CLUSTERED INDEX [IX_Clustered] ON [Table] 
(
 [a] ASC,
 [b] ASC,
 [c] ASC,
 [d] ASC,
 [e] ASC,
 [f] ASC
)WITH (PAD_INDEX  = ON, STATISTICS_NORECOMPUTE  = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, IGNORE_DUP_KEY = OFF, FILLFACTOR = 90, ONLINE = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = OFF) ON [PRIMARY]

15:30 小时/2 小时

ALTER TABLE Table ADD CONSTRAINT
PK_hands PRIMARY KEY NONCLUSTERED 
(
 e,
 h
) WITH( STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]

4 小时/1 小时

现在最常用的选择查询需要 << 以前通常需要 10 到 15 分钟，现在只需 10 秒。不错的改进！插入时间似乎也快了一点。

I made the changes and it didn't take too long.
Here are the times for each operation, first time is when run on a backup server with a single 7200RPM drive, and the second on the main server with 15k drives in RAID.

ALTER TABLE Table DROP CONSTRAINT [PK_Table]

2:39 hrs / 19 minutes

CREATE CLUSTERED INDEX [IX_Clustered] ON [Table] 
(
 [a] ASC,
 [b] ASC,
 [c] ASC,
 [d] ASC,
 [e] ASC,
 [f] ASC
)WITH (PAD_INDEX  = ON, STATISTICS_NORECOMPUTE  = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, IGNORE_DUP_KEY = OFF, FILLFACTOR = 90, ONLINE = OFF, ALLOW_ROW_LOCKS  = ON, ALLOW_PAGE_LOCKS  = OFF) ON [PRIMARY]

15:30 hrs / 2 hrs

ALTER TABLE Table ADD CONSTRAINT
PK_hands PRIMARY KEY NONCLUSTERED 
(
 e,
 h
) WITH( STATISTICS_NORECOMPUTE = OFF, IGNORE_DUP_KEY = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]

4 hrs / 1 hr

The select query most often used now takes < 10 seconds where it often took 10 to 15 minutes before. Nice improvement! Insert times seem a bit faster too.

回复收藏 0 原文