Lucene&paoding全文检索
我想问一个关于lucene的问题:
比如说我通过padding(庖丁分词器)将一个词语 比如:昆仑山
问题1:
我在基础词库中加入了 "仑山"
在lucene建立索引的时候,会创建"仑山" 这个词的索引,在查询昆仑山的时候这个词可以被查询到,但是如果我直接查询"仑" 却查不个到”昆仑山"这个词,paoding的jar包有它基本的词库,但是有没有一种方式:
比如说:我查数据库中一张产品表的数据,拿出记录中产品名字,分词,在lucene创建索引的时候,有最基本的 单个词的索引 在索引里面至少有 "昆" "仑" "山"单个字的索引,而我在词语增加的时候每次都在基础词库中加入单个字的索引
求大神指导,小弟正在研究lucene
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
lucene的分词是将要分析的内容转化成一个个Term(token),如果你要一个字一个字都变成一项的话,直接用StandardAnalyzer就好了
例如 用IK分词器,smart=true/false,基本可以搞定你所说的一切情况。如果还需要单字,可以再同时使用startAnalyzer;