Sphinx-coreseek匹配结果的问题

发布于 2017-01-09 22:42:59 字数 341 浏览 1171 评论 1

遇到一个现象:

要匹配的记录为:“天天都是a12的日子”

搜索:a12 可以匹配到结果,但搜索a1 或 a2 或 12 都无法得到结果,

注:(在建索引时 a12、a1、 a2 、 12 都没有加入字典)

有谁知道怎么解决吗?


以下由@熊欲轻飞 补充:
我遇到一样的问题,中文搜索无误,字母或数字搜索不准确。
@fengming 提到配置mmseg.ini的方法,我之前已试过,奇怪的是不行。

比如“代号H123456”,默认分词是

代号/x H123456/x 

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

晚风撩人 2017-04-20 17:55:36

coreseek在调用mmseg分词时,调用字典把a12分解成一个整词。
分词结果:

Array ( [0] => 天天 [1] => 都是 [2] => a12 [3] => 日子 )

有种解决方法,但是比较麻烦,需要手动建立一个字形表。
即:

a1 > a12
a2 > a12
12 > a12

你可以在手册中搜索wordforms 关键字,有很详细的解释。

顺便说下,如果方便的话把csft.conf关键部分贴出了。

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文