levenshtein-distance

levenshtein-distance

文章 0 浏览 4

更快的 C#(或其他 .NET)Levenshtein 距离实现

晚安, 我已经研究模糊字符串匹配有一段时间了,并且使用 C 和一些指针,我可以编写一个非常快速的(根据我的需要)实现两个字符串之间的 Levenshtein…

舟遥客 2024-10-04 01:05:00 4 0

在 Python 中对约 100,000 个短字符串进行聚类

我想通过 q​​-gram 距离或简单的“bag 距离”或者 Python 中的 Levenshtein 距离之类的东西对大约 100,000 个短字符串进行聚类。我打算填写一个距离…

他是夢罘是命 2024-10-03 07:33:22 14 0

评估字符串匹配的质量

将模式与一组字符串逐一进行比较,同时评估模式与每个字符串的匹配程度的最佳方法是什么?根据我对正则表达式的有限经验,使用正则表达式将字符串与模…

贱人配狗天长地久 2024-10-01 00:09:00 9 0

如何在相似性度量和差异性(距离)度量之间进行转换?

是否有一种通用方法可以在相似性度量和距离度量之间进行转换? 考虑相似性度量,例如两个字符串共有的 2 元语法的数量。 2-grams('beta', 'delta') = …

极度宠爱 2024-09-30 08:59:12 9 0

如何修改 Levenshteins 编辑距离以计算“相邻字母交换”作为 1 编辑

我正在使用 Levenshteins 编辑距离算法,我想扩展它来计算换位 - 即交换相邻字母的数量——作为 1 次编辑。未修改的算法计算从另一个字符串到达​​某…

心房的律动 2024-09-29 09:49:23 7 0

.NET 中的编辑 DFA

下午好, 有谁知道 .NET 中 Levenshtein DFA(确定性有限自动机)的“开箱即用”实现(或者很容易翻译成它)?我有一本非常大的字典,其中包含超过 16…

忆悲凉 2024-09-28 10:21:56 11 0

关于如何改进当前模糊搜索实施的建议

我目前正在致力于实现术语网络服务的模糊搜索,并且正在寻找有关如何改进当前实现的建议。代码太多,无法分享,但我认为解释可能足以引发深思熟虑的建…

禾厶谷欠 2024-09-28 04:26:07 7 0

是否可以计算正则表达式和字符串之间的编辑距离?

如果是这样,请解释一下如何。 回复:什么是距离 - “两个字符串之间的距离定义为将一个字符串转换为另一个字符串所需的最小编辑次数。” 例如,xyz …

眼眸 2024-09-28 02:12:22 10 0

计算相对编辑距离 - 有意义吗?

我使用 Daitch-Mokotoff soundexing 和 Damerau-Levenshtein 来确定应用程序中的用户条目和值是否“相同”。 编辑距离应该用作绝对值吗?如果我有一个…

短暂陪伴 2024-09-26 05:57:19 12 0

修改 Levenshtein Distance 算法以不计算所有距离

我正在研究模糊搜索实现,作为实现的一部分,我们使用 Apache 的 StringUtils.getLevenshteinDistance。目前,我们正在为模糊搜索设定一个特定的最大…

雪花飘飘的天空 2024-09-26 04:36:00 6 0

Damerau - Levenshtein 距离,添加阈值

我有以下实现,但我想添加一个阈值,因此如果结果大于它,则停止计算并返回。 我该怎么办呢? 编辑:这是我当前的代码,尚未使用 threshold ...目标是…

甜味拾荒者 2024-09-25 21:59:06 11 0

Levenshtein 距离的 Haskell 尾递归性能问题

我正在 Haskell 中计算 Levenshtein 距离,并对以下性能感到有点沮丧问题。如果你用 Haskell 最“正常”的方式实现它,就像下面的(dist),一切都很…

你怎么这么可爱啊 2024-09-25 09:56:39 8 0

如何配置 solr / lucene 来执行 levenshtein 编辑距离搜索?

我有一个很长的单词列表,我将其放入一个非常简单的 SOLR / Lucene 数据库中。我的目标是从单项查询列表中找到“相似”单词,其中“相似性”具体理解…

旧街凉风 2024-09-16 12:58:20 6 0

如何纠正 Damerau-Levenshtein 实施中的错误?

我带着另一个较长的问题回来了。尝试过许多基于 Python 的 Damerau-Levenshtein 编辑距离实现,我终于找到了下面列出的 作为 editdistance_reference(…

烟若柳尘 2024-09-13 11:37:41 9 0

仅字符串部分的编辑距离 (Java)

我有一个在线网络应用程序,带有顶部菜单树,用于打开不同的小部件来执行不同的任务。随着应用程序变得越来越强大,该树变得越来越大并且难以导航。我…

没︽人懂的悲伤 2024-09-13 05:26:05 7 0
更多

推荐作者

胡图图

文章 0 评论 0

zt006

文章 0 评论 0

z祗昰~

文章 0 评论 0

冰葑

文章 0 评论 0

野の

文章 0 评论 0

天空

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文