当前位置：文江博客话题详情

我不明白elasticsearch滚动搜索中的解释

发布于 01-16 16:53 字数 285 浏览 2 评论 0原文

“保持初始搜索上下文的活动对于主动更新索引来说成本很高。”

上面这句话中的高成本是指内存占用吗？

那么，为什么内存占用这么高呢？

为了在保持活动状态的同时对索引的更新请求进行排队？

或者因为您正在内存中缓存活动索引快照？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

有木有妳兜一样2025-01-23 16:53:45

来自官方文档：

滚动返回在初始搜索请求时与搜索匹配的所有文档。它忽略对这些文档的任何后续更改。 [...] 搜索上下文由初始请求创建，并通过后续请求保持活动状态。 [...]
通常，后台合并过程通过将较小的段合并在一起以创建新的更大的段来优化索引。一旦不再需要较小的段，它们就会被删除。此过程在滚动期间继续，但是开放的搜索上下文会阻止旧段被删除，因为它们仍在使用中。
保持较旧的段处于活动状态意味着需要更多的磁盘空间和文件句柄。确保您已将节点配置为拥有足够的可用文件句柄。请参阅文件描述符。
此外，如果分段包含已删除或更新的文档，则搜索上下文必须跟踪分段中的每个文档在初始搜索请求时是否处于活动状态。如果索引上有许多打开的卷轴需要持续删除或更新，请确保您的节点有足够的堆空间。

上述文档中添加了重点，以强调为什么在相当长的一段时间内保持一个或多个滚动上下文处于活动状态的成本很高。 Elasticsearch 尽力保持一切新鲜和活力并丢弃旧数据，但滚动上下文基本上是将旧数据放在生命支持上，并将其在角落里多存放一段时间，然后再让它使用当不再需要滚动上下文时死亡。

这就是为什么需要更多的资源（主要是存储、文件句柄和堆）来保持滚动上下文的活动，这就是所谓的“高成本”