用于比较词汇相似度的数字哈希

发布于 2024-11-17 03:18:15 字数 230 浏览 9 评论 0原文

是否有某种形式的哈希算法可以为相似的单词生成相似的数值？我想会有很多误报，但这似乎对搜索修剪有用。

编辑：Soundex 很简洁，可能会派上用场，但理想情况下，我想要一些行为如下的东西： abs(f('horse') - f('hoarse')) abs(f('horse') - f('hoarse')) abs(f('马') - f('山羊'))

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

◇流星雨 2024-11-24 03:18:15

Soundex 算法生成与输入单词中的音素相对应的键字符串。 http://www.archives.gov/research/census/soundex.html

如果您只想比较字符串之间的相似度，请尝试 Levenstein Distance。 http://en.wikipedia.org/wiki/Levenshtein_distance

回复收藏 0 原文

瞳孔里扚悲伤 2024-11-24 03:18:15

您所说的称为局部敏感哈希。它可以应用于不同类型的输入（图像、音乐、文本、空间位置，无论您需要什么）。

不幸的是（尽管进行了搜索）我找不到任何字符串 LSH 算法的实际实现。

回复收藏 0 原文

三寸金莲 2024-11-24 03:18:15

您随时可以尝试 Soundex 看看它是否符合您的需求。

回复收藏 0 原文

~没有更多了~

关于作者

新一帅帅

暂无简介

文章

27 人气

关注发私信

alipaysp_snBf0MSZIv

文章 0 评论 0

关注

梦断已成空

文章 0 评论 0

关注

瞎闹

文章 0 评论 0

关注

凯凯我们等你回来

文章 0 评论 0

关注

寄意

文章 0 评论 0

关注

似梦非梦

文章 0 评论 0

友情链接

文江博客

用于比较词汇相似度的数字哈希

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签