当前位置：文江博客话题详情

使用哈希检查字符串匹配，无需仔细检查整个字符串

发布于 2024-10-01 09:03:18 字数 506 浏览 4 评论 0原文

我正在尝试尽快检查两个字符串是否相同。我可以在不比较整个字符串的情况下保护自己免受哈希冲突吗？

我有一个由字符串作为键控的项目的缓存。我存储字符串的哈希值、字符串的长度以及字符串本身。（我目前正在使用 djb2 生成哈希值。）

检查是否输入字符串与缓存中的项目匹配，我计算输入的哈希，并将其与存储的哈希进行比较。如果匹配，我将输入的长度（作为计算哈希的副作用而得到）与存储的长度进行比较。最后，如果匹配，我会对输入和存储的字符串进行完整的字符串比较。

是否有必要进行完整的字符串比较？例如，是否有一种字符串哈希算法可以在数学上保证没有两个相同长度的字符串会生成相同的哈希值？如果不是，算法能否保证如果前 N 个字符中的任何一个不同，两个相同长度的不同字符串将生成不同的哈希码？

基本上，任何在字符串不同时提供 O(1) 性能但在匹配时优于 O(n) 性能的字符串比较方案都将比我现在所做的有所改进。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

可是我不能没有你 2024-10-08 09:03:18

例如，是否有一种字符串哈希算法，可以从数学上保证没有两个相同长度的字符串会生成相同的哈希值？

不，也不可能有。想一想：散列的长度是有限的，但字符串却没有。为了便于论证，假设哈希值是 32 位。您可以创建超过 20 亿个相同长度的唯一字符串吗？当然可以 - 您可以创建无限数量的唯一字符串，因此比较哈希值不足以保证唯一性。这个论点可以扩展到更长的哈希值。

如果不是，算法能否保证如果前 N 个字符中的任何一个不同，两个相同长度的不同字符串将生成不同的哈希码？

嗯，是的，只要散列中的位数与字符串中的位数一样多，但这可能不是您正在寻找的答案。

用于循环冗余校验的一些算法具有保证，例如如果恰好有一位不同，那么 CRC 保证在一定的位运行长度上不同，但这仅适用于相对较短的运行。

回复收藏 0 原文

夜空下最亮的亮点 2024-10-08 09:03:18

如果您使用现代哈希函数（例如安全哈希算法 (SHA)< 之一），您应该不会发生冲突。 /a> 变体。

回复收藏 0 原文

~没有更多了~

关于作者

浮萍、无处依

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

使用哈希检查字符串匹配，无需仔细检查整个字符串

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

tomoekana

无边思念无边月

眼角的笑意。

在风中等你

是你

syong71

友情链接

使用哈希检查字符串匹配，无需仔细检查整个字符串

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

tomoekana

无边思念无边月

眼角的笑意。

在风中等你

是你

syong71

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。