Sphinx-coreseek匹配结果的问题
遇到一个现象:
要匹配的记录为:“天天都是a12的日子”
搜索:a12 可以匹配到结果,但搜索a1 或 a2 或 12 都无法得到结果,
注:(在建索引时 a12、a1、 a2 、 12 都没有加入字典)
有谁知道怎么解决吗?
以下由@熊欲轻飞 补充:
我遇到一样的问题,中文搜索无误,字母或数字搜索不准确。
@fengming 提到配置mmseg.ini的方法,我之前已试过,奇怪的是不行。
比如“代号H123456”,默认分词是
代号/x H123456/x
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
coreseek在调用mmseg分词时,调用字典把a12分解成一个整词。
分词结果:
Array ( [0] => 天天 [1] => 都是 [2] => a12 [3] => 日子 )
有种解决方法,但是比较麻烦,需要手动建立一个字形表。
即:
a1 > a12
a2 > a12
12 > a12
你可以在手册中搜索wordforms 关键字,有很详细的解释。
顺便说下,如果方便的话把csft.conf关键部分贴出了。