当前位置：文江博客话题详情

Java string-hashing

我应该如何实现这些要求的字符串哈希函数？

发布于 2024-08-18 09:55:56 字数 312 浏览 6 评论 0 原文

好的，我需要一个哈希函数来满足以下要求。这个想法是能够将属于同一逻辑结构但存储在文件系统的不同物理区域中的目录链接在一起。

我需要用 Java 实现它，它必须在执行会话之间保持一致，并且可以返回 long。

我将对目录名称/字符串进行哈希处理。这应该有效，以便 "somefolder1" 和 "somefolder2" 将返回不同的哈希值，"JJK" 和 "JJL" 也会返回不同的哈希值。我还想了解何时可能发生冲突。

有什么建议吗？

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

悲念泪 2024-08-25 09:55:56

好吧，几乎所有散列函数都具有输入的微小变化会导致输出发生较大变化的属性，这意味着“somefolder1”和“somefolder2”将始终产生不同的散列。

至于冲突，看哈希输出有多大就可以了。 Java 自己的 hashcode() 返回一个 int，因此您可能会比 MD5 或 SHA- 1，例如，分别产生 128 和 160 位。

不过，您不应该尝试从头开始创建这样的函数。

但是，我不太明白您的用例是否不应该发生冲突，或者如果很少发生冲突是否可以接受。对于链接文件夹，我肯定会使用保证唯一的标识符，而不是可能多次出现的标识符。

回复收藏 0 原文

↙温凉少女 2024-08-25 09:55:56

您没有描述在什么情况下不同字符串应该返回相同哈希值。

一般来说，我会通过首先实现相等函数来设计哈希函数。这应该会告诉你哪些数据位需要包含在哈希中，哪些数据位应该被丢弃。如果两个不同数据位之间的相等性很复杂（例如不区分大小写），那么希望有一个相应的哈希函数用于该特定比较。

无论你做什么，都不要假设相等的哈希值意味着相等的键（即哈希值是唯一的）——这始终是潜在问题的原因。

回复收藏 0 原文

兔小萌 2024-08-25 09:55:56

Java 的 String hashcode 会给你一个 int，如果你想要一个 long，你可以取 String 的 MD5 和的最低有效 64 位。

可能会发生冲突，您的系统必须为此做好准备。也许如果您更详细地说明哈希码的用途，我们就可以看到冲突是否会导致问题。

回复收藏 0 原文

流云如水 2024-08-25 09:55:56

时，在 N 个哈希之后发生冲突的几率为 50%

N = .5 + SQRT(.25 - 2 * M * ln(.5))

对于具有 M 个可能值的均匀随机哈希函数，当查找生日问题以进行更多分析。

如果您提前知道所有密钥，则可以使用完美哈希来避免冲突。

With a uniformly random hash function with M possible values, the odds of a collision happening after N hashes are 50% when

N = .5 + SQRT(.25 - 2 * M * ln(.5))

Look up the birthday problem for more analysis.

You can avoid collisions if you know all your keys in advance, using perfect hashing.

回复收藏 0 原文

~没有更多了~

关于作者

Spring初心

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

我应该如何实现这些要求的字符串哈希函数？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

tomoekana

无边思念无边月

眼角的笑意。

在风中等你

是你

syong71

友情链接

我应该如何实现这些要求的字符串哈希函数？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

tomoekana

无边思念无边月

眼角的笑意。

在风中等你

是你

syong71

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。