字符串的模糊匹配
例如:山西
和山西省
,新疆
和新疆维吾尔自治区
,摩托罗拉
和Moto
,facebook
和fb
,等等,应该用什么算法呢?
只知道字符串的精确匹配和字符串最短编辑距离肯定是不行的了。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
例如:山西
和山西省
,新疆
和新疆维吾尔自治区
,摩托罗拉
和Moto
,facebook
和fb
,等等,应该用什么算法呢?
只知道字符串的精确匹配和字符串最短编辑距离肯定是不行的了。
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
接受
或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
发布评论
评论(3)
那要看你怎么个模糊法
indexOf(“abc”) 从开头向后查找字符串第一次出现的位置,如果没找到返回-1
word2vector模型得到单词的词向量,通过词向量的余弦距离最近的topk