当前位置：文江博客话题详情

如何删除重复的条目？

发布于 2024-08-11 07:51:36 字数 150 浏览 4 评论 0原文

我必须向现有表添加唯一约束。这很好，只是表已经有数百万行，并且许多行违反了我需要添加的唯一约束。

删除有问题的行的最快方法是什么？我有一个 SQL 语句可以查找重复项并删除它们，但它需要很长时间才能运行。还有其他方法可以解决这个问题吗？也许备份表，然后在添加约束后恢复？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

清浅ˋ旧时光 2024-08-18 07:51:36

其中一些方法看起来有点复杂，我通常这样做：

给定表 table，想要在 (field1, field2) 上唯一它保持最大 field3 的行：

DELETE FROM table USING table alias 
  WHERE table.field1 = alias.field1 AND table.field2 = alias.field2 AND
    table.max_field < alias.max_field

例如，我有一个表 user_accounts，我想对电子邮件添加唯一约束，但我有一些重复项。还说我想保留最近创建的一个（重复项中的最大 id）。

DELETE FROM user_accounts USING user_accounts ua2
  WHERE user_accounts.email = ua2.email AND user_account.id < ua2.id;

注意 - USING 不是标准 SQL，它是 PostgreSQL 扩展（但非常有用），但最初的问题特别提到了 PostgreSQL。

Some of these approaches seem a little complicated, and I generally do this as:

Given table table, want to unique it on (field1, field2) keeping the row with the max field3:

DELETE FROM table USING table alias 
  WHERE table.field1 = alias.field1 AND table.field2 = alias.field2 AND
    table.max_field < alias.max_field

For example, I have a table, user_accounts, and I want to add a unique constraint on email, but I have some duplicates. Say also that I want to keep the most recently created one (max id among duplicates).

DELETE FROM user_accounts USING user_accounts ua2
  WHERE user_accounts.email = ua2.email AND user_account.id < ua2.id;

Note - USING is not standard SQL, it is a PostgreSQL extension (but a very useful one), but the original question specifically mentions PostgreSQL.

如何删除重复的条目？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（16）

唯一值

重复值

又一个双重复

选择重复行

删除重复行

Unique values

Duplicate values

One more double duplicate

Select duplicate rows

Delete duplicate rows

关于作者

相关话题

热门标签

推荐作者

qq_FjTq5B

18273202778

WordPress小学生

〃温暖了心ぐ

迷乱花海

niuniu

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。