有没有什么方法可以找到最接近的匹配
我想比较两个字符串,例如:
str1 = "this is a dynamic data";
str2 = "this is a <data_1> data";
有没有什么方法可以找到最接近的匹配项?我使用了三元搜索树(TST)字典函数。还有其他方法可以做这种事情吗?
I want to compare two strings, such as:
str1 = "this is a dynamic data";
str2 = "this is a <data_1> data";
Is there any method that will find the nearest match? I have used Ternary Search Tree (TST) Dictionary functions. Are there any other ways to do this kind of thing?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
杰卡德相似系数
怎么样?http://en.wikipedia.org/wiki/Jaccard_index
它很容易实现,并且提供了良好的效果相似度得分。不过,你必须对你的句子进行标记;)
What about the
Jaccard similarity coefficient
?http://en.wikipedia.org/wiki/Jaccard_index
It's easy to implement and gives a good similarity score. You have to tokenize your sentences though ;)
BCL 中没有找到字符串最接近匹配的方法。
但你可以自己推出。
通过以下链接了解“Levenshtein Distance”
There is no such method in BCL that finds nearest match of the string.
But you can roll your own.
read about "Levenshtein Distance" on the following link
我不确定 C# 中的这个东西,但是 SQL 中确实有这个东西,
In am not sure about this thing in C#, but yes that is there in SQL,