在 Lucene 中使用变音符号索引和搜索法语文本
我正在使用 Lucene 搜索。
我上传了一个法语文件(french.txt),内容如下。
multimédia francophone pour l'enseignement du français langue étrangère
如果我搜索 francophone
那么它会在搜索结果中显示该文件。但是,当我搜索 multimédia
或 français
或 étrangère
时,它没有显示任何结果。
我尝试使用 org.apache.lucene.analysis.fr.FrenchAnalyzer,但它仍然无法正常工作。
我们如何搜索上述的法语单词?
I am using Lucene Search.
I have uploaded a French file (french.txt) with the following content.
multimédia francophone pour l'enseignement du français langue étrangère
If I search for francophone
then it shows the file in the search result. But when I search for multimédia
or français
or étrangère
, it does not show any results.
I have tried to use org.apache.lucene.analysis.fr.FrenchAnalyzer
, but it is still not working.
How can we search French words such as those above?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(3)
您是否在分析器中为该文本索引的字段使用 ISOLatin1AccentFilterFactory?确保如果您有它用于索引分析器,您也有它用于查询分析器。
Do you use a ISOLatin1AccentFilterFactory in the analyzers for the field where this text is indexed? Make sure that if you have it for the index analyzer, you also have it for the query analyzer.
顺便提一句。如果您使用 ISOLatin1AccentFilter 请注意,它已被弃用,取而代之的是 ASCIIFoldingFilter
BTW. If you are using ISOLatin1AccentFilter note that it was deprecated in favor of ASCIIFoldingFilter
基本上,您有 2 个选项:
Basically, you have 2 options: