使用 DBsight lucene 的动词屈折形式?
我知道 dbsight 允许使用同义词和停用词进行搜索,但这是否也能处理动词的屈折形式,例如,对于“游泳”,它应该找到 Swim、swils、swim、swam 和 swum
DBSight Wiki 上的链接:http://wiki.dbsight.com/index.php?title=User_dictionary
I know dbsight allows synonyms and stop words for searching but does this take care of inflectional forms of a verb too e.g. for 'swim' it should find swim, swims, swimming, swam, and swum
Link on DBSight Wiki : http://wiki.dbsight.com/index.php?title=User_dictionary
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
您正在寻找的行为可以使用词形还原来实现。我不知道现有的 Lucene 分析器可以做到这一点。 Basis Tech 的 Lucene 包 可以进行词形还原,但不是免费的,我不知道它是否可以与数据库视线。
The behavior you are looking for can be implemented using lemmatization. I am unaware of an existing Lucene analyzer that does this. Basis Tech's Lucene package does lemmatization, but is not free, and I do not know whether it works with dbsight.
Lucene 附带了一个名为“Lucene SnowBall 词干分析器”的词干分析器 (http: //lucene.apache.org/java/2_4_0/api/contrib-snowball/index.html),结果 DBsight 将其公开为名为 SnowBall 的分析器 - [语言] 例如SnowBall - 英语、SnowBall - 法语等..
Lucene comes with a stemmer called "Lucene SnowBall stemmer' (http://lucene.apache.org/java/2_4_0/api/contrib-snowball/index.html). Turns out that DBsight is exposing it as analyzers named SnowBall - [Language] e.g SnowBall - English, SnowBall - French etc..