快速、可扩展的字符串查找

发布于 2024-09-26 00:53:43 字数 278 浏览 2 评论 0原文

我有一套 500 万根琴弦。这些当前存储在单列 MySQL 表中。我的应用程序必须执行查找并检查给定的字符串是否在集合中。这当然可以通过 HashSet（在 Java 中）来完成。但我不是构建自定义解决方案，而是想知道是否有任何现有的、广泛使用的、经过验证的解决方案可以做到这一点？这似乎是一个常见的场景。该解决方案应该是可扩展的（集合可能会增加到超过 500 万）、具有故障转移（因此可能是分布式的）并且在大量请求下表现良好。有什么建议吗？

更新：我的应用程序还可以查询以检查全局（500 万个）集中是否存在给定的字符串集。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

我还不会笑 2024-10-03 00:53:43

您可以尝试 Trie 或 Patricia-trie。第二个内存效率更高。另外在这里您可以找到两种数据结构[Trie、TreeSet]、内存数据库及其性能的比较。

回复收藏 0 原文

挽心 2024-10-03 00:53:43

尝试 memcached，一个高性能的分布式内存对象缓存系统。您使用键/值哈希进行查找。 Facebook 与许多其他高度可扩展的网站一样使用 memcached。需要存储更多字符串吗？只需向集群添加更多 memcached 实例即可。另外，您可以在 2 层缓存设置中使用，首先查询 memcached，如果缓存未命中，则查询完整数据库。

您是否考虑过在 MySQL 数据库中添加列索引？支持哈希、b 树和 r 树。

MySQL 还可以复制和集群以获得高可扩展性。

回复收藏 0 原文