levenshtein-distance

levenshtein-distance

文章 0 浏览 6

如何修改 Levenshteins 编辑距离以计算“相邻字母交换”作为 1 编辑

我正在使用 Levenshteins 编辑距离算法,我想扩展它来计算换位 - 即交换相邻字母的数量——作为 1 次编辑。未修改的算法计算从另一个字符串到达​​某…

心房的律动 2024-09-29 09:49:23 16 0

.NET 中的编辑 DFA

下午好, 有谁知道 .NET 中 Levenshtein DFA(确定性有限自动机)的“开箱即用”实现(或者很容易翻译成它)?我有一本非常大的字典,其中包含超过 16…

忆悲凉 2024-09-28 10:21:56 19 0

关于如何改进当前模糊搜索实施的建议

我目前正在致力于实现术语网络服务的模糊搜索,并且正在寻找有关如何改进当前实现的建议。代码太多,无法分享,但我认为解释可能足以引发深思熟虑的建…

禾厶谷欠 2024-09-28 04:26:07 17 0

是否可以计算正则表达式和字符串之间的编辑距离?

如果是这样,请解释一下如何。 回复:什么是距离 - “两个字符串之间的距离定义为将一个字符串转换为另一个字符串所需的最小编辑次数。” 例如,xyz …

眼眸 2024-09-28 02:12:22 17 0

计算相对编辑距离 - 有意义吗?

我使用 Daitch-Mokotoff soundexing 和 Damerau-Levenshtein 来确定应用程序中的用户条目和值是否“相同”。 编辑距离应该用作绝对值吗?如果我有一个…

短暂陪伴 2024-09-26 05:57:19 18 0

修改 Levenshtein Distance 算法以不计算所有距离

我正在研究模糊搜索实现,作为实现的一部分,我们使用 Apache 的 StringUtils.getLevenshteinDistance。目前,我们正在为模糊搜索设定一个特定的最大…

雪花飘飘的天空 2024-09-26 04:36:00 11 0

Damerau - Levenshtein 距离,添加阈值

我有以下实现,但我想添加一个阈值,因此如果结果大于它,则停止计算并返回。 我该怎么办呢? 编辑:这是我当前的代码,尚未使用 threshold ...目标是…

甜味拾荒者 2024-09-25 21:59:06 18 0

Levenshtein 距离的 Haskell 尾递归性能问题

我正在 Haskell 中计算 Levenshtein 距离,并对以下性能感到有点沮丧问题。如果你用 Haskell 最“正常”的方式实现它,就像下面的(dist),一切都很…

你怎么这么可爱啊 2024-09-25 09:56:39 17 0

如何配置 solr / lucene 来执行 levenshtein 编辑距离搜索?

我有一个很长的单词列表,我将其放入一个非常简单的 SOLR / Lucene 数据库中。我的目标是从单项查询列表中找到“相似”单词,其中“相似性”具体理解…

旧街凉风 2024-09-16 12:58:20 15 0

如何纠正 Damerau-Levenshtein 实施中的错误?

我带着另一个较长的问题回来了。尝试过许多基于 Python 的 Damerau-Levenshtein 编辑距离实现,我终于找到了下面列出的 作为 editdistance_reference(…

烟若柳尘 2024-09-13 11:37:41 16 0

仅字符串部分的编辑距离 (Java)

我有一个在线网络应用程序,带有顶部菜单树,用于打开不同的小部件来执行不同的任务。随着应用程序变得越来越强大,该树变得越来越大并且难以导航。我…

没︽人懂的悲伤 2024-09-13 05:26:05 14 0

如何将 python/cython unicode 字符串转换为长整数数组,以进行 levenshtein 编辑距离

可能的重复: 如何纠正此 Damerau-Levenshtein 实现中的错误? 我有以下 Cython 代码(改编自 bpbio 项目),该项目Damerau- Levenenshtein 编辑距离…

画尸师 2024-09-12 18:42:35 21 0

如何使用编辑距离为相似字符串创建阈值并考虑拼写错误?

我们最近在工作中遇到了一个有趣的问题,我们发现数据库中存在重复的用户提交数据。我们意识到大部分数据之间的编辑距离只是所讨论的两个字符串之间的…

染墨丶若流云 2024-09-11 08:40:37 18 0

使用优化的 Levenshtein 算法查找最近邻居

我最近发布了一个关于优化计算 Levenshtein 距离的算法的问题 ,这些回复将我引向维基百科关于 Levenshtein Distance 的文章。 文章提到,如果给定查…

起风了 2024-09-08 20:07:45 9 0

R 中的快速编辑距离?

是否有一个包包含以 C 或 Fortran 代码实现的 Levenshtein 距离计数函数?我有很多字符串需要比较,而来自 MiscPsycho 的 stringMatch 对此来说太慢了…

人海汹涌 2024-09-08 10:13:16 14 0
更多

推荐作者

alipaysp_snBf0MSZIv

文章 0 评论 0

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文