Sphinx 中的拼写更正？

发布于 2024-09-02 05:50:54 字数 517 浏览 9 评论 0 原文

我打算将基于 Sphinx 的搜索集成到网站中，但我发现没有内置的拼写纠正支持。

网上的人们建议使用 pspell 或其他第三方库来完成任务，但问题是我要搜索的数据主要包含品牌名称等“技术”术语，因此我不认为通用库将包括他们。

另一方面，Xapian 声明提供基于索引数据的拼写纠正支持，这正是我想要的。值得使用 Xapian 代替吗？我仍然很困惑应该使用哪个全文搜索引擎：Sphinx 似乎相当不错，但缺乏 Xapian（或者可能是 Lucene？）的一些很酷的功能，而看起来后者的社区较小，文档较少。

我认为我可以使用自定义词典来解决 pspell 词典中不存在的单词的问题，但我不确定这是否会造成明显的性能损失？我将在一个非常受欢迎的网站上使用搜索系统进行聚光灯搜索（通过 ajax 对输入的每个字母进行单独搜索），因此性能很重要。

理想情况下，我想让一些字段（例如品牌名称）比普通词典具有更高的优先级，但我想这并不重要，因为大多数品牌名称与其他单词截然不同。

也欢迎对自定义全文搜索引擎的总体设计提出任何建议。

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

初吻给了烟 2024-09-09 05:50:54

Sphinx 没有内置的拼写纠正功能，但可以使用 Sphinx 来实现。只能在那里找到一篇关于此的操作方法文章（由 Sphinx 作者撰写）http://habrahabr.ru/ blogs/sphinx/61807（俄语，您可以使用 GoogleTranslate 阅读本文。请参阅名为“Я понял, это намек”的文章的第二部分。）

我最近实现了该方法 - 效果完美！