当前位置：文江博客话题详情

如何在计算两个字符串的编辑距离时找到它们的共同部分

发布于 2024-10-05 15:54:29 字数 535 浏览 11 评论 0原文

我必须在源字符串和一组模式字符串之间执行模糊匹配。这种匹配由公式给出 1 - D(I,P) / max(长度(I),长度(P))
其中

I 是输入字符串
P 是模式字符串
D(I,P) 是 I 和 P 之间的编辑距离。

一旦我找到使该分数最大化的 P，我希望获得 I 和 P 的公共部分之间的映射P

例如：如果 I="sunday" 且 P="saturday"，则映射将类似于以下对的列表：
{{0, 0}, {1, 3}, {3, 5}, {4, 6}, {5, 7}}
因为常见字符是

中的 's'、'u'、'd'、'a' 和 'y'这篇维基百科文章，人们可以轻松找到一种计算编辑距离的实现，但我并不完全清楚如何从它描述的过程中构建的矩阵中获取映射。谁能启发我吗？

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

北恋 2024-10-12 15:54:29

您作为示例给出的映射根本不包含我所看到的编辑距离，因为它只是寻找常见字符。也许我误解了你，但你不需要编辑距离矩阵来映射常见字符；您唯一一次查看编辑距离是在 D(I,P) 计算期间确定得分最高的模式字符串。要生成您作为示例提供的映射，只需迭代两个字符串即可确定用于识别对的字符索引。

回复收藏 0 原文

蓝色星空 2024-10-12 15:54:29

从同一数组的两个副本开始，称为“源”和“目标”，它们是枚举的源字符串中的位置。删除操作会从两个数组中删除相应的元素，并减少目标数组中的后续值。插入会增加目标数组中的以下值。然后只需压缩两个数组并生成地图即可。

回复收藏 0 原文

~没有更多了~

关于作者

陌伤ぢ

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

如何在计算两个字符串的编辑距离时找到它们的共同部分

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如何在计算两个字符串的编辑距离时找到它们的共同部分

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。