如何计算两个文本/字符串之间的相似度或差异百分比?

发布于 2024-09-09 05:33:03 字数 213 浏览 2 评论 0 原文

进一步解释

假设我有两个如下所示的字符串

我是一个会飞的超级男孩!真的。

我是能打破墙壁的超级男孩! 真的。

所以有些角色是相似的 我是超级男孩真的。 。 是否有任何东西可以用来查找这两个字符串之间的百分比相似性/差异。

Explaining it further

Assume i have two strings like below

I am a super boy who can Fly! Really .

I am super boy who can Break walls!
Really .

So some characters are similar I am super boy who can and Really . .
Is there anything ready to use to find percentage similarity/diffrence between those two strings.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

初雪 2024-09-16 05:33:03

您应该研究一下 Levenshtein Distance。

http://en.wikipedia.org/wiki/Levenshtein_distance

You should look into Levenshtein Distance.

http://en.wikipedia.org/wiki/Levenshtein_distance

毁虫ゝ 2024-09-16 05:33:03

这个对类似问题的回答给出了 Levenshtein、Jaro Winkler 和 Smith Waterman Gotoh 算法的 PHP 代码。

我发现 Levenshtein 和 Jaro Winkler 对于较小字符串之间的拼写错误通常会给出良好的结果。虽然 Smith Waterman Gotoh 擅长比较句子,就像您问题中的示例一样。

This SO answer to a similar question gives the PHP code for the Levenshtein, Jaro Winkler and Smith Waterman Gotoh algorithms.

I've found that Levenshtein and Jaro Winkler generally give good results for spelling mistakes between smaller strings. While the Smith Waterman Gotoh is good at comparing sentences like the example in your question.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文