Lucene&paoding全文检索

发布于 2021-11-18 03:31:56 字数 493 浏览 928 评论 2

我想问一个关于lucene的问题:

比如说我通过padding(庖丁分词器)将一个词语  比如:昆仑山

问题1:

我在基础词库中加入了  "仑山"  
在lucene建立索引的时候,会创建"仑山" 这个词的索引,在查询昆仑山的时候这个词可以被查询到,但是如果我直接查询"仑" 却查不个到”昆仑山"这个词,paoding的jar包有它基本的词库,但是有没有一种方式:

比如说:我查数据库中一张产品表的数据,拿出记录中产品名字,分词,在lucene创建索引的时候,有最基本的 单个词的索引  在索引里面至少有 "昆"  "仑"   "山"单个字的索引,而我在词语增加的时候每次都在基础词库中加入单个字的索引


    求大神指导,小弟正在研究lucene


如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

终止放荡 2021-11-22 01:51:29

lucene的分词是将要分析的内容转化成一个个Term(token),如果你要一个字一个字都变成一项的话,直接用StandardAnalyzer就好了

裸钻 2021-11-21 18:41:39

例如 用IK分词器,smart=true/false,基本可以搞定你所说的一切情况。如果还需要单字,可以再同时使用startAnalyzer;

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文