php 中找到最相似字符串的最佳方法?
天哪, PHP 有很多字符串函数,例如 levenshtein、similar_text 和 soundex,可以比较字符串的相似性。 http://www.php.net/manual/en/function.leven…
如何以最少的操作次数将字符串转换为回文?
这是 问题 表示以最少的操作次数将字符串转换为回文。我知道它类似于 Levenshtein 距离 但我还无法解决它 例如,对于输入mohammadsajjadhossain,输出…
编辑:MySQL + PHP
$word = strtolower($_GET['term']); $lev = 0; $q = mysql_query("SELECT `term` FROM `words`"); while($r = mysql_fetch_assoc($q)) { $r['term'] …
语言特定怪癖的 Damerau–Levenshtein 距离
对于讲荷兰语的人来说,两个字符“ij”被认为是一个字母,可以很容易地与“y”交换。 对于我正在从事的项目,我想要一个 Damerau– 的变体 - Levensht…
使用 Levenshtein 编辑距离的 Google 风格搜索建议
好的,大家正在使用 jQuery-UI AutoComplete 以及来自 sql-sever 2008 db 的结果来处理搜索建议。使用 AdventureWorks DB Products 表进行测试。我想…
计算多个连续字符串之间的编辑距离
我有一个包含 str1 str2 str3... 的文本文件,我想输出另一个包含 LD(str1,str2) LD(str2,str3) LD(str3,str4) 等的文本文件。如何做到这一点?任何语…
尝试在 T-SQL 查询中使用编辑距离 - 请帮助优化
我正在尝试使用我在网上找到的编辑算法来计算与搜索项最接近的值。以实现模糊术语匹配。我当前的查询运行时间约为 45 秒。我希望我能优化它。我已经为…
如何在计算两个字符串的编辑距离时找到它们的共同部分
我必须在源字符串和一组模式字符串之间执行模糊匹配。这种匹配由公式给出 1 - D(I,P) / max(长度(I),长度(P)) 其中 I 是输入字符串 P 是模式字符串 D(…
更快的 C#(或其他 .NET)Levenshtein 距离实现
晚安, 我已经研究模糊字符串匹配有一段时间了,并且使用 C 和一些指针,我可以编写一个非常快速的(根据我的需要)实现两个字符串之间的 Levenshtein…
在 Python 中对约 100,000 个短字符串进行聚类
我想通过 q-gram 距离或简单的“bag 距离”或者 Python 中的 Levenshtein 距离之类的东西对大约 100,000 个短字符串进行聚类。我打算填写一个距离…
如何在相似性度量和差异性(距离)度量之间进行转换?
是否有一种通用方法可以在相似性度量和距离度量之间进行转换? 考虑相似性度量,例如两个字符串共有的 2 元语法的数量。 2-grams('beta', 'delta') = …