SQL 中的主键 Select Distinct 如何工作？

发布于 2025-01-06 04:22:17 字数 169 浏览 0 评论 0原文

SQL 优化器如何处理主键上的 Select Distinct？例如，

员工表 - (EmpId int 主键，EmpName)

从 Employee 中选择不同的 EmpId。

考虑到 EmpId 已经不同，优化器会拒绝 unique 关键字吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

梓梦 2025-01-13 04:22:17

尝试使用和不使用 DISTINCT 关键字并比较执行计划。

SQL Server 将为两者生成相同的计划。对于其他 RDBMS 来说是 YMMV。

回复收藏 0 原文

情定在深秋 2025-01-13 04:22:17

在 Oracle 11g 下尝试过，结果不同。

select USERID from TPM_USER

生成：

SELECT STATEMENT    7.0 7   242479  667 2668    7                   ALL_ROWS                                            
TABLE ACCESS (FULL) 7.0 7   242479  667 2668    1   TPMDBO  TPM_USER    FULL    TABLE   ANALYZED    1

和：

select distinct USERID from TPM_USER

生成：

SELECT STATEMENT    8.0 7   24725738    667 2668    8                   ALL_ROWS                                            
HASH (UNIQUE)   8.0 7   24725738    667 2668    1           UNIQUE                                                  
TABLE ACCESS (FULL) 7.0 7   242479  667 2668    1   TPMDBO  TPM_USER    FULL    TABLE   ANALYZED    1

USERID 是 TPM_USER 上的主键，以防不清楚。

更新：

我有点恼火 Oracle 可能这么愚蠢，所以我在我们的生产服务器上尝试了相同的查询，该服务器的数据量大约是原来的一千倍。这次，两个查询计划是相同的（两次都使用了索引，并且没有进行全表扫描）。这让我相信规划者在决定走哪条路线时会考虑表统计数据。

生产（有或没有DISTINCT）：

SELECT STATEMENT    3.0 3   461492  3521    14084   3                   ALL_ROWS                                            
INDEX (FAST FULL SCAN)  3.0 3   461492  3521    14084   1   TPMDBO  TPM_USER_PK FAST FULL SCAN  INDEX (UNIQUE)  ANALYZED

Tried under Oracle 11g and they produce different results.

select USERID from TPM_USER

Produces:

SELECT STATEMENT    7.0 7   242479  667 2668    7                   ALL_ROWS                                            
TABLE ACCESS (FULL) 7.0 7   242479  667 2668    1   TPMDBO  TPM_USER    FULL    TABLE   ANALYZED    1

And:

select distinct USERID from TPM_USER

Produces:

SELECT STATEMENT    8.0 7   24725738    667 2668    8                   ALL_ROWS                                            
HASH (UNIQUE)   8.0 7   24725738    667 2668    1           UNIQUE                                                  
TABLE ACCESS (FULL) 7.0 7   242479  667 2668    1   TPMDBO  TPM_USER    FULL    TABLE   ANALYZED    1

USERID is the primary key on TPM_USER in case that wasn't clear.

UPDATE:

I was somewhat irked that Oracle could be this stupid, so I tried the same queries on our production server which has about a thousand times more data. This time, the two query plans were identical (the index was used both times, and no full table scan was done). This leads me to believe the planner will take the table statistics into account when deciding which route to go.

Production (with or without DISTINCT):

SELECT STATEMENT    3.0 3   461492  3521    14084   3                   ALL_ROWS                                            
INDEX (FAST FULL SCAN)  3.0 3   461492  3521    14084   1   TPMDBO  TPM_USER_PK FAST FULL SCAN  INDEX (UNIQUE)  ANALYZED

回复收藏 0 原文