多语言内容的全文搜索库
什么是可以很好地处理多语言数据的优秀全文搜索库(免费/许可)?
What is a good full-text search library (free/licensed) that works well with multilingual data?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
Lucene 拥有适用于多种语言的分析器。当然,只有当您知道每个文档使用哪种语言时,这才有效:要么给它们一个语言标签,要么使用 语言猜测器。
(不过,如果您想通过管道中的机器翻译进行跨语言检索,恐怕您只能靠自己了。)
Lucene has analyzers for a wide variety of languages. That only works, of course, if you know which language each document is in: either give them a language tag or use a language guesser.
(Though if you want to do cross-lingual retrieval with machine translation in the pipeline, you're on your own, I'm afraid.)