使用 Sphinx 进行同义词搜索
有人为狮身人面像上的同义词编写了形态引擎吗?或者最好的选择仍然是创建一个 单词形式 字典声明了我所有的同义词。另外这将如何影响词干。在文档中它指出:
词干提取不适用于找到的单词 在表单列表中
这是否意味着如果我定义了运行>在我的单词形式中运行,运行不会被阻止为运行,因为运行出现在我的单词形式列表中?
Has somebody written a morphology engine for synonyms on sphinx. Or is the best bet still to create a word forms dictionary which declares all my synonyms. Also how will this affecting stemming. In the documentation it states:
stemming is not applied to words found
in the forms list
Does this mean that if I have defined running > run in my wordform that runs will not be stemmed to run because run appears in my word forms list?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
例如,您可以在 mongo 或 mysql 中创建同义词,并进行查询预处理,因此当有人搜索时:
您将查询更改为:
允许您对这些单词进行形态搜索,因为词干不适用于您提到的单词形式。
You can create synonyms in mongo or mysql for example, and do query preporcessing, so when somebody do search with:
you will change the query to:
which allow you to do morphology search on those words, because stemming doesn't apply to word-forms as you have mentioned.