当前位置：文江博客话题详情

对于未知输入具有良好一致性的哈希函数

发布于 2024-12-22 14:27:26 字数 781 浏览 1 评论 0原文

我正在寻找一个可以对大量输入进行分区的哈希函数数据对于少量分区（例如 100 或 256）。这意味着我预计会发生很多碰撞，但我并不关心碰撞。

输入数据事先未知。我期望字符串具有一定的长度可能在 6 到 100 字节之间。字符串的分布可能非常糟糕（例如，很大一部分充满空格或仅包含数字）。

CRC 算法是最先浮现在脑海中的想法之一。 CRC8 已被提议，但没有提供有关其的信息均匀性；对于 CRC32 显然一致性不太好。

有简单或通用哈希函数，但没有透露它们的一致性。

Bob Jenkins 有一篇关于返回 a 的哈希函数的完整文章 32 位值。我想对于均匀分布的 32 位值所有可能的 8 位子集也应该均匀分布，所以有是很好的候选人。但也许将 32 位值减少到 8 位值是否有更简单的 8 位算法？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

还不是爱你 2024-12-29 14:27:26

我发现 sdbm 算法表现出良好的一致性，而且非常简单：

        h := 0.
        forEach ch in str {
            h := (h * 65599) + ch;
        }

I found the sdbm algorithm to show good uniformity, being quite simple:

        h := 0.
        forEach ch in str {
            h := (h * 65599) + ch;
        }

回复收藏 0 原文

~没有更多了~

关于作者

别理我

暂无简介

文章

27 人气

关注发私信

忆悲凉

文章 0 评论 0

关注

hgfg1645

文章 0 评论 0

关注

qq_qLPLYi

文章 0 评论 0

关注

戏舞

文章 0 评论 0

关注

殊姿

文章 0 评论 0

关注

﹂绝世的画

文章 0 评论 0

友情链接

文江博客

对于未知输入具有良好一致性的哈希函数

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者