URL路径相似度/字符串相似度算法
我的问题是我需要比较 URL 路径并推断它们是否相似。下面我提供了要处理的示例数据: # GROUP 1 /robots.txt # GROUP 2 /bot.html # GROUP 3 /phpMyAd…
如何仅使用 PostgreSQL 创建简单的模糊搜索?
我的基于 RoR 的网站上的搜索功能存在一些问题。我有很多带有一些代码的产品。此代码可以是任何字符串,例如“AB-123-lHdfj”。现在我使用 ILIKE 运算…
Solr Lucene模糊匹配返回错误结果
我正在尝试为我的应用程序测试 SOLR 以查找字符串之间的百分比匹配。 我现在配置了 solr 并仅为名字匹配定义了模式,我在模式中使用了 text_general …
使用 levenshtein 匹配目标字符串 +额外的文字
我正在开发一个网站转换项目,我需要匹配不精确的字符串。我正在考虑使用 leveshtein,但我不知道应该为我的任务设置哪些参数。 假设我有一个目标字符…
LevensteinDistance - Commons Lang 3.0 API
使用 Commons Lang api,我可以通过 LevensteinDistance。结果是将一个字符串更改为另一个字符串所需的更改次数。我希望结果在 0 到 1 的范围内,这样…
CoffeeScript 中的编辑距离公式?
我正在尝试创建或查找 Levenshtein Distance 公式(又名编辑距离)的 CoffeeScript 实现。这是我到目前为止所拥有的,任何帮助将不胜感激。 levenshte…
Jarowinkler 作为 SQLite 的可加载扩展
我想知道是否有人已经实现了 Jarowinler 函数作为 SQLite 的可加载扩展。 我正在寻找与“SQLite-Levenshtein”等效的版本。 Mateusz Adamowski 将 lev…
获取最接近的字符串匹配
我需要一种方法来将多个字符串与测试字符串进行比较并返回与其非常相似的字符串:( TEST STRING: THE BROWN FOX JUMPED OVER THE RED COW CHOICE A :…
Levenshtein Distance:从矩阵推断编辑操作
我用 C++ 编写了 Levenshtein 算法 如果我输入: 字符串 s: 民主党 string t: Republican 我得到矩阵 D 已填满,并且可以在 D[10][8] = 8 中读取操作…
查找两个字符串之间的多个差异
我想找出两个字符串之间的差异。例如,如果 line1 = "My name is ABC" line2 = "My age is xyz" 那么我应该能够得到名称 - 年龄和 ABC - xyz 的差异。…
使用Data.Memocombinators实现编辑距离算法
假设我想为 Levensthein 距离(编辑距离)实现常用的动态规划算法。提出递归非常容易: editDistance [] ys = length ys editDistance xs [] = length…
通过有效单词从一个单词到另一个单词的最短路径(无图)
我遇到了编辑距离问题的这种变体: 找到从一个单词到另一个单词的最短路径,例如storm->power,使用 isValidWord() 函数验证每个中间单词。没有其他方…