当前位置：文江博客话题详情

nedtrie（按位 trie）搜索操作的复杂性

发布于 2024-10-06 02:14:14 字数 387 浏览 11 评论 0原文

我最近听说了 nedtries 并决定尝试实现它们，但他们的搜索操作的复杂性让我感到困扰；我无法忍受他们为什么要这么快。

据我了解，他们的搜索操作的预期复杂度应该是 O(m/2)，其中 m 是密钥的大小（以位为单位）。如果将其与传统二叉树中搜索操作的复杂性进行比较，你得到： log2(n) >= m/2

假设密钥长度为 32 位： log2(n) >= 16 <=> n >= 65536

因此 nedtries 应该比从 65536 个项目开始的二叉树更快。然而，作者声称它们总是比二叉树更快，所以我的假设关于它们的复杂性的判断是错误的，或者在 nedtrie 中搜索的每一步执行的计算要快得多。

那么，那又怎样呢？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

悲喜皆因你 2024-10-13 02:14:14

（请注意，我是 nedtries 的作者）。我认为我在 nedtries 页面前面对复杂性的解释有意义吗？也许不是。

您缺少的关键是，位之间的差异决定了复杂性。差异越大，搜索成本越低，反之差异越小，搜索成本越高。

事实上，它的工作原理源于现代的乱序处理器。作为一个总体简化，如果您避免使用主内存，您的代码运行速度将比依赖主内存时快 40-80 倍。这意味着您可以在从内存加载单个内容的时间内执行 50-150 个操作。这意味着您可以进行位扫描并找出我们接下来应该查看哪个节点，其时间不会比将该节点的缓存行加载到内存中所需的时间长得多。

这有效地消除了复杂性分析中的逻辑、位扫描和其他所有内容。它们都可能是 O(N^N)，这并不重要。现在重要的是，要查看的下一个节点的选择实际上是自由的，因此必须加载进行检查的节点数量是缩放约束，因此它是在总数中查看的节点的平均数量。节点数是其平均复杂度，因为主内存的缓慢性是迄今为止最大的复杂度限制。

这有道理吗？这意味着奇怪的事情，比如如果某些位在密钥的一端密集排列，但在密钥的另一端松散排列，则在密集排列的一端进行搜索将非常慢（接近 O(log N)，其中 N 是数字密集元素）比在松散堆积端搜索（接近 O(1)）要好。

很快有一天，我会抽出时间来添加利用按位尝试这一功能的新函数，因此您可以说“将此节点添加到松散/密集的空间中并返回您选择的密钥”以及各种变体主题。可悲的是，一如既往，这取决于时间和对时间的要求。

尼尔

回复收藏 0 原文