当前位置：文江博客话题详情

如何快速将许多具有重复项的记录添加到可扩展存储引擎

发布于 2024-11-06 14:23:27 字数 286 浏览 0 评论 0原文

我需要向 ESE 数据库添加几百万条数据记录。除其他值外，每条记录都有一个唯一的字符串值。这个值可以被认为是一个键。

对记录感兴趣的是，输入集中可能存在同一记录的多个相同实例。输入后，我只想要一个包含每个唯一字符串的记录。

我的问题是如何做到这一点 - 如何快速过滤掉重复项？

现在，我仅在搜索密钥后添加每条记录，如果该条目已存在，我会跳过它。如果数据库中没有，我会添加记录和进度。这里最大的成本是对每个条目进行搜索。

有什么想法可以让它变得非常快吗？是否有办法键入该值，使得添加重复项会失败？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

心房的律动 2024-11-13 14:23:27

您可以通过将 JET_bitIndexUnique 传递到 JetCreateIndex 来在字符串列上创建唯一索引：

JetCreateIndex(sesid, tableid, "myindex", JET_bitIndexUnique, "+string_col\0", 13, 100));

插入重复值会因 JET_errKeyDuplicate 失败。

如果你的琴弦很短，这种方法是最好的。如果您的字符串很长，您应该使用字符串的哈希值来测试唯一性。

Your can just create a unique index on the string column by passing JET_bitIndexUnique into JetCreateIndex:

JetCreateIndex(sesid, tableid, "myindex", JET_bitIndexUnique, "+string_col\0", 13, 100));

An insertion of a duplicate value with fail with JET_errKeyDuplicate.

This approach is best if your strings are short. If your strings are long you should use a hash of the string to test for uniqueness.

回复收藏 0 原文

千柳 2024-11-13 14:23:27

DTS.
BULK INSERT.
SSIS.
Choose as you wish

DTS.
BULK INSERT.
SSIS.
Choose as you wish

回复收藏 0 原文

~没有更多了~

关于作者

幸福不弃

暂无简介

0 文章

0 评论

23 人气

关注发私信

1CH1MKgiKxn9p

文章 0 评论 0

关注

ゞ记忆︶ㄣ

文章 0 评论 0

关注

JackDx

文章 0 评论 0

关注

信远

文章 0 评论 0

关注

yaoduoduo1995

文章 0 评论 0

关注

霞映澄塘

文章 0 评论 0

友情链接

文江博客

如何快速将许多具有重复项的记录添加到可扩展存储引擎

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

如何快速将许多具有重复项的记录添加到可扩展存储引擎

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。