当前位置：文江博客话题详情

哈希表与自平衡搜索树

发布于 2024-09-10 15:34:12 字数 349 浏览 1 评论 0原文

我很想知道使用自平衡树技术来存储项目比使用哈希表更重要的推理是什么。

我发现哈希表无法维护插入顺序，但我始终可以在顶部使用链表来存储插入顺序序列。

我发现对于少量的值，哈希函数会增加成本，但我总是可以将哈希函数与密钥一起保存以加快查找速度。

我知道哈希表比直接实现红黑树更难实现，但在实际实现中，人们不会愿意为此付出额外的努力吗？

我发现对于哈希表，发生冲突是正常的，但是使用开放寻址技术（例如允许将密钥保存在哈希表本身中的双重哈希），问题是否已减少到不予支持的效果对于这样的实现，红黑树？

我很好奇我是否严格忽略了哈希表的一个缺点，该缺点仍然使红黑树在实际应用程序（如文件系统等）中相当可行的数据结构。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

蓝眼睛不忧郁 2024-09-17 15:34:12

这是我能想到的：

有些数据无法进行哈希处理（或者哈希成本太高），因此无法存储在哈希表中。
树按照您需要的顺序（排序）保存数据，而不是插入顺序。即使您通过哈希表运行链表，也无法（有效地）使用哈希表来做到这一点。
树有更好的最坏情况性能

回复收藏 0 原文

孤独难免 2024-09-17 15:34:12

存储分配是另一个考虑因素。每次填充哈希表中的所有存储桶时，您都需要分配新的存储空间并重新哈希所有内容。如果您提前知道数据的大小，则可以避免这种情况。另一方面，平衡树根本不会遇到这个问题。

回复收藏 0 原文

烈酒灼喉 2024-09-17 15:34:12

只是想添加：

平衡二叉树具有可预测的获取数据 [log n] 的时间，与数据类型无关。很多时候，估计应用程序的响应时间对于您的应用程序可能很重要。 [哈希表可能具有不可预测的响应时间]。请记住，对于较小的 n，就像在大多数常见用例中一样，内存中查找的性能差异几乎不重要，系统的瓶颈将在其他地方，有时您只是想让系统更简单调试和分析。
与哈希表相比，树通常具有更高的内存效率，并且实现起来更简单，无需对输入键的分布和可能的冲突等进行任何分析。
与哈希

回复收藏 0 原文

緦唸λ蓇 2024-09-17 15:34:12

以我的拙见，自平衡树作为学术主题非常有效。而我
不知道任何可以被限定为“”的直接实现
红黑树”。

在现实世界中，内存墙使它们的效率远低于纸上的效率。

考虑到这一点，哈希表是不错的选择，特别是如果您不练习的话
它们是学术风格（忘记表格大小限制，你会神奇地解决
表调整大小问题和几乎所有冲突问题）。

简而言之：保持简单。如果这对您来说很简单，那么对您的计算机来说也很简单。

回复收藏 0 原文

山川志 2024-09-17 15:34:12

我认为如果你想查询一系列键而不是一个键，自平衡树结构会比哈希表结构表现更好。

回复收藏 0 原文

多彩岁月 2024-09-17 15:34:12

我能想到的几个原因：

树是动态的（空间复杂度为 N），而哈希表通常被实现为固定大小的数组，这意味着它们通常会用 K 大小来初始化，其中 K > 。 N，所以即使哈希图中只有 1 个元素，仍然可能有 100 个空槽占用内存。这样做的另一个影响是：
增加基于数组的哈希表的大小成本高昂（平均时间为 O(N)，最坏情况为 O(N log N)），而树可以在恒定时间内增长（O(1 )) + (定位插入点的时间 (O(log N))
树中的元素可以按排序顺序收集（使用例如：中序遍历）。因此，您可以通常会得到一个排序列表作为树的免费福利。与
哈希图相比，树可以具有更好的最坏情况性能，具体取决于哈希图的实现方式（例如：具有链接的哈希图将具有 O(N) 最坏情况，而自平衡的哈希图则具有 O(N) 最坏情况。树可以保证所有操作的最坏情况为 O(log N)，

自平衡树和哈希图在最佳最坏情况下的最坏情况效率均为 O(log N)（假设哈希图确实处理碰撞），但哈希图可以具有更好的平均情况性能（通常接近 O(1)），而树将具有恒定的 O(log N)。这是因为即使 hashmap 可以在 O(1) 中定位插入索引，它也必须考虑哈希冲突（多个元素哈希到同一数组索引），因此在最好的情况下会降级为自平衡树（例如hashmap的Java实现），即hashmap中的每个元素都可以实现为自平衡树，存储所有已散列到给定数组单元格的元素。

回复收藏 0 原文

~没有更多了~