当前位置：文江博客话题详情

了解 Count Sketch 数据结构和相关算法

发布于 2024-12-25 02:05:24 字数 628 浏览 0 评论 0原文

致力于了解 CountSketch 数据结构及其相关算法。它似乎是寻找流数据中常见元素的一个很好的工具，它的附加性质使得它具有一些有趣的属性，可以发现频率的巨大变化，也许类似于 Twitter 用于趋势主题的东西。

论文对于那些已经接触过的人来说有点难以理解暂时远离更多的学术方法，这里有上一篇文章确实帮助了一些，至少对我来说仍然留下了很多问题。

据我了解，Count Sketch 结构类似于布隆过滤器。然而，哈希函数的选择让我感到困惑。该结构是一个 N × M 表，具有 N 个散列函数，其中 M 个可能的值确定要更改的“桶”，每个 N 的另一个散列函数 s 是“成对独立”的，

散列是从通用散列族中选择的，说一下 h(x) = ((ax+b) % some_prime) % M 吗？

如果是这样，返回 +1 或 -1 的 s 哈希值是从哪里选择的？从其中一个桶中减去的原因是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

苍暮颜 2025-01-01 02:05:24

他们从存储桶中减去，以使由其他事件引起的加法/减法的平均效果为0。如果一半的时间我添加“foo”的计数，一半的时间我减去“foo”的计数，那么在期望中，“foo”的计数不会影响“bar”计数的估计。

选择像您描述的那样的通用哈希函数确实可行，但它对于理论而不是实践来说最重要。对您最喜欢的合理哈希函数加盐也可以，您只是无法使用一些固定哈希函数根据预期值有意义地编写证明。

回复收藏 0 原文

~没有更多了~

关于作者

月朦胧

暂无简介

文章

25 人气

关注发私信

友情链接

文江博客

了解 Count Sketch 数据结构和相关算法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

忆悲凉

hgfg1645

qq_qLPLYi

戏舞

殊姿

﹂绝世的画

友情链接

了解 Count Sketch 数据结构和相关算法

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

忆悲凉

hgfg1645

qq_qLPLYi

戏舞

殊姿

﹂绝世的画

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。