将 Hibernate 搜索结果与关系数据库查询合并

发布于 2024-12-10 01:23:24 字数 554 浏览 1 评论 0原文

我有一个复杂的查询，需要对某些字段进行全文搜索，并对其他字段进行基本限制。 Hibernate Search 文档强烈建议不要添加数据库查询限制为全文搜索查询，而是建议将所有必要字段放入全文索引中。我遇到的问题是其他字段是不稳定的；值可能每分钟左右发生变化，并且对数据库的更新可能发生在执行搜索的 JVM 之外，因此本地 Lucene 索引很可能对于这些字段来说已经过时。

在这里寻找策略建议。到目前为止，我想到的最好方法是首先执行数据库查询（仅获取对象 ID），然后执行全文搜索，从而手动连接结果。并以某种方式通过数据库中的对象 ID 集有效地过滤 Lucene 结果。当然，我不知道每个单独的查询会得到多少结果，所以我担心性能和内存。在最坏的情况下，每行可能有数万行。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

誰認得朕 2024-12-17 01:23:24

我对其他想法非常感兴趣，因为我们有一个非常相似的场景。

我们最多只需要显示 50 个结果行，每行进行几次查找。我们使用索引中的 db pk id 对 lucene 索引运行查询，并从数据库中每行提取查找。它对我们来说仍然具有高性能。

由于您似乎想要处理多于几行和查找，我确实考虑了一种替代方案。对任何数据库行更新添加时间戳。这将允许我们查询数据库中的过时索引，然后迭代调用相关文档的重新索引。

回复收藏 0 原文

孤独难免 2024-12-17 01:23:24

我有同样的问题，并做了一个单独的 Lucene 和条件查询。如果我首先执行条件查询，我将使用生成的 ids 为 Lucene 搜索应用自定义 IdFilter，该过滤器检查结果是否在第一个查询的给定 Id 集合中。然而，这种方法不能很好地扩展，因为在我的例子中，第一次查询后的结果数量可能很大，并且过滤器仅限于 1024 个 id。我没有找到好的解决方案，但我根据预期结果的数量更改了两个查询的顺序。第一个查询应该是过滤掉大部分结果的查询。

回复收藏 0 原文