使用 Sphinx 进行同义词搜索

发布于 2024-10-17 17:18:31 字数 298 浏览 3 评论 0原文

有人为狮身人面像上的同义词编写了形态引擎吗?或者最好的选择仍然是创建一个 单词形式 字典声明了我所有的同义词。另外这将如何影响词干。在文档中它指出:

词干提取不适用于找到的单词 在表单列表中

这是否意味着如果我定义了运行>在我的单词形式中运行,运行不会被阻止为运行,因为运行出现在我的单词形式列表中?

Has somebody written a morphology engine for synonyms on sphinx. Or is the best bet still to create a word forms dictionary which declares all my synonyms. Also how will this affecting stemming. In the documentation it states:

stemming is not applied to words found
in the forms list

Does this mean that if I have defined running > run in my wordform that runs will not be stemmed to run because run appears in my word forms list?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

ゃ人海孤独症 2024-10-24 17:18:31

例如,您可以在 mongo 或 mysql 中创建同义词,并进行查询预处理,因此当有人搜索时:

可乐

您将查询更改为:

(可乐|百事可乐|雪碧)

允许您对这些单词进行形态搜索,因为词干不适用于您提到的单词形式。

You can create synonyms in mongo or mysql for example, and do query preporcessing, so when somebody do search with:

Cola

you will change the query to:

(cola|pepsi|sprite)

which allow you to do morphology search on those words, because stemming doesn't apply to word-forms as you have mentioned.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文