edit-distance

edit-distance

文章 0 浏览 4

在 Java 中快速比较字符串和集合

我正在尝试计算字符串与集合的编辑距离以找到最接近的匹配。我当前的问题是该集合非常大(大约 25000 个项目),因此我必须将集合缩小到长度相似的字…

顾北清歌寒 2025-01-02 18:50:30 1 0

搜索引擎字符串匹配

在线搜索引擎用于对拼写错误的单词提出建议的典型算法是什么。我不一定指的是 Google,而是任何具有搜索功能的网站,例如 Amazon.com。假设我搜索单词…

烛影斜 2024-12-29 04:47:12 1 0

通过交换编辑距离

编辑距离查找一个字符串到另一个字符串所需的插入、删除或替换的次数。我还想在这个算法中包含交换。例如,“apple”和“appel”的编辑距离应为 1。…

雄赳赳气昂昂 2024-12-25 18:29:59 1 0

查找所有子字符串的编辑距离的算法

给定 2 个字符串 s 和 t。我需要找到 s 到 t 的编辑距离(Levenshtein 距离)中的每个子字符串。实际上,我需要知道 s 中的每个 i 位置从位置 i 开始…

最终幸福 2024-12-15 20:56:19 4 0

用于检查转录准确性/编辑距离的脚本的伪代码

我需要编写一个脚本(可能是用 Ruby 编写的),该脚本将获取一段文本,并将该文本的多个录音转录与原始文本进行比较,以检查准确性。如果这完全令人困…

初相遇 2024-12-10 03:51:12 3 0

CoffeeScript 中的编辑距离公式?

我正在尝试创建或查找 Levenshtein Distance 公式(又名编辑距离)的 CoffeeScript 实现。这是我到目前为止所拥有的,任何帮助将不胜感激。 levenshte…

摇划花蜜的午后 2024-11-19 04:24:51 5 0

最长公共子序列 (LCS) 长度的快速(呃)算法

问题:需要两个字符串之间的 LCS 长度。字符串的大小最多为 100 个字符。字母表是常见的 DNA 字母表,4 个字符“ACGT”。动态方法不够快。 我的问题是…

优雅的叶子 2024-11-18 01:33:06 5 0

判断一个企业名称是否与另一个企业名称非常相似 - Python

我正在处理一个大型企业数据库。 我希望能够比较两个公司名称的相似性,看看它们是否可能重复。 以下是应测试重复概率很高的企业名称列表,有什么好的…

泅人 2024-11-16 00:47:33 7 0

Java:两个列表之间的差异

我公司的猫群应用程序跟踪一群猫。它需要定期比较 previousOrder 和 currentOrder(每个都是 ArrayList),并通知 cat-wranglers 任何更改。 每只猫都…

很酷又爱笑 2024-11-13 09:30:40 5 0

通过有效单词从一个单词到另一个单词的最短路径(无图)

我遇到了编辑距离问题的这种变体: 找到从一个单词到另一个单词的最短路径,例如storm->power,使用 isValidWord() 函数验证每个中间单词。没有其他方…

聊慰 2024-10-26 18:34:49 8 0

详细字间距

我将如何显示单词之间的详细距离。 例如,程序的输出可能是: Words are "car" and "cure": Replace "a" with "u". Add "e". Levenshtein 距离不能满…

揽月 2024-10-21 03:39:03 7 0

句子的词级编辑距离

是否有一种算法可以让您找到两个句子之间的单词级编辑距离? 例如,“A Big Fat Dog”和“The Big House with the Fat Dog”有 1 个替补,3 个插入…

挽容 2024-10-18 01:01:58 6 0

数据集成问题——如何集成相似的实体

我有一个数据库,在同一个表中有非常相似的行。这些行很相似,因为它们具有几乎相同的列值。我需要将这些相应的行集成到一行中。 例如,这两个用户(u…

旧话新听 2024-10-09 07:56:00 10 0

如何纠正 Damerau-Levenshtein 实施中的错误?

我带着另一个较长的问题回来了。尝试过许多基于 Python 的 Damerau-Levenshtein 编辑距离实现,我终于找到了下面列出的 作为 editdistance_reference(…

烟若柳尘 2024-09-13 11:37:41 12 0

如何将 python/cython unicode 字符串转换为长整数数组,以进行 levenshtein 编辑距离

可能的重复: 如何纠正此 Damerau-Levenshtein 实现中的错误? 我有以下 Cython 代码(改编自 bpbio 项目),该项目Damerau- Levenenshtein 编辑距离…

画尸师 2024-09-12 18:42:35 17 0
更多

推荐作者

佚名

文章 0 评论 0

羁客

文章 0 评论 0

文章 0 评论 0

夏日落

文章 0 评论 0

隐诗

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文