当前位置：文江博客话题详情

适当的数据结构可加快检索过程（数据大小：约 200,000 个值，全部为字符串）

发布于 2024-12-04 17:40:01 字数 223 浏览 5 评论 0原文

我有一个大约 200, 000 个值的大型数据集，它们都是字符串。我应该使用哪种数据结构，以便搜索和检索过程更快。插入是一次性的，所以即使插入速度慢也没什么关系。

哈希映射可能是一种解决方案，但其他选择是什么？谢谢

编辑：一些指示 1. 我正在寻找完全匹配的内容，而不是部分匹配的内容。 2.我必须用PHP来完成这个任务。 3. 有什么方法可以将如此大量的数据以树的形式或其他格式保存在缓存中吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

娇妻 2024-12-11 17:40:01

如果您需要的只是字符串查找，那么您确实应该考虑不使用映射或哈希字典。使用这些时，在字符串大小 M 的查找中，N 个项目的复杂性保证为 O(M x log(N))，或者，对于散列来说，最好摊销为 O(M) 和一个大的常量乘数。使用非循环确定性有限自动机 (ADFA) 进行基本查找会更有效，如果需要关联数据，则使用 Trie。这些将一次一个字符地遍历数据结构，以非常小的乘数复杂度给出 O(M)。

基本上，您需要一种在数据结构使用字符串时解析字符串的数据结构，而不是必须在查找的每个节点进行完整字符串比较的数据结构。您所看到的红黑树的常见复杂顺序以及假设 O(1) 比较，这对于字符串来说并非如此。字符串的复杂度是 O(M)，并且会传播到所有使用的比较。

回复收藏 0 原文