当前位置：文江博客话题详情

是否有一套从关系数据库构建 Lucene 索引的最佳实践？

发布于 2024-07-08 08:26:25 字数 271 浏览 6 评论 0原文

我正在考虑使用 Lucene 和/或 Solr 在 RDBMS 支持的 Web 应用程序中提供搜索。对我来说不幸的是，我浏览过的所有文档都涉及如何从索引中获取数据；我更关心如何建立有用的索引。是否有这样做的“最佳实践”？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

忆悲凉 2024-07-15 08:26:25

多个应用程序会写入数据库吗？如果是这样，那就有点棘手了；您必须有某种机制来识别要提供给 Lucene 索引器的新记录。

需要考虑的另一点是您想要一个覆盖所有表的索引，还是每个表一个索引。一般来说，我推荐一个索引，该索引中有一个字段来指示记录来自哪个表。

Hibernate 支持全文搜索，如果你想搜索持久对象而不是非结构化文档。

您应该了解一个名为 Compass 的 OpenSymphony 项目。我自己一直远离它，主要是因为它似乎比搜索需要的方式复杂。另外，正如我从文档中可以看出的那样（我承认我没有时间阅读全部内容），它将 Lucene 段作为 blob 存储在数据库中。如果您熟悉 Lucene 架构，Compass 在数据库之上实现了 Lucene Directory。我认为这是错误的做法。我将利用数据库内置的索引支持并实现 Lucene IndexReader。同样的批评也适用于分布式缓存实现等。