插入忽略或插入不在其中的位置

发布于 2024-12-02 07:49:42 字数 528 浏览 5 评论 0原文

我有一个 900 万行的表，由于其庞大的规模，我正在努力处理所有这些数据。

我想要做的是将导入 CSV 添加到表中而不覆盖数据。

在我做这样的事情之前； INSERT if not in(select email from tblName where source = "number" and email != "email") INTO (email...) VALUES ("email"...)

但我担心我会崩溃再次服务器。我希望能够将 10,000 行插入到表中，但前提是它不在源=“number”的表中。

否则我会在电子邮件列上使用唯一的。

简而言之，我想通过检查两件事尽快插入而不向表中引入重复项。如果 email != "email" AND source != "number" 则插入表中，否则不执行任何操作。我也不想要错误报告。

我很抱歉我的措辞不好，而且这个问题听起来有点愚蠢。

我只是很难适应无法通过下载备份并上传（如果出现问题）来测试数据。我讨厌大数据集:)

谢谢大家的宝贵时间 -大事

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

迷路的信 2024-12-09 07:49:42

如果这些字段上有唯一键，则可以使用 LOAD DATA INFILE 和 IGNORE 选项。它比逐行插入更快，也比多重插入更快。

看看 http://dev.mysql.com/doc/refman /5.1/en/load-data.html

回复收藏 0 原文

霓裳挽歌倾城醉 2024-12-09 07:49:42

对 email 和 source 列设置 UNIQUE 约束。

然后执行：

INSERT INTO table_name(email, source, ...) VALUES ('email', 'source', ...)
ON DUPLICATE KEY UPDATE email = email;

INSERT IGNORE 不会通知您任何类型的错误。我不会推荐它。我也不推荐INSERT ... WHERE NOT IN。 MySQL 已经为此提供了很好的优化功能。这就是为什么 INSERT ... ON DUPLICATE KEY UPDATE 存在的原因。

Set a UNIQUE constraint on email and source columns.

Then do:

INSERT INTO table_name(email, source, ...) VALUES ('email', 'source', ...)
ON DUPLICATE KEY UPDATE email = email;

INSERT IGNORE will not notify you of any kind of error. I would not recommend it. Neither would I recommend INSERT ... WHERE NOT IN. MySQL has an already well optimized functionality for that. That's why INSERT ... ON DUPLICATE KEY UPDATE is there.

回复收藏 0 原文

~没有更多了~