Hibernate 的批量获取算法是如何工作的？

发布于 2024-09-14 05:46:35 字数 616 浏览 9 评论 0原文

我在“Manning - Java Persistence with Hibernate”中找到了批量获取算法的描述：

什么是真正的批量抓取算法？ (...) 想象一下批量大小为 20 总数量 119 必须是未初始化的代理分批加载。在启动时， Hibernate读取映射元数据并创建 11 个批处理加载器内部。每个装载机都知道有多少它可以初始化的代理：20、10、9、 8, 7, 6, 5, 4, 3, 2, 1。目标是最小化内存消耗加载器创建并创建足够的每个可能的批次的装载机可以产生fetch。另一个目标是尽量减少SQL的数量显然，选择。初始化 119 代理 Hibernate 执行七个批次（您可能期望六个，因为6×20> 119）。该批次应用的装载机有五个 20 次、10 次、9 次、由 Hibernate 自动选择。

但我仍然不明白它是如何工作的。

为什么使用 11 个批量装载机？
为什么批量加载器可以初始化：20、10、9、8、7、6、5、4、3、2、1 个代理？

如果有人可以提出一步一步的算法......:)

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

最佳男配角 2024-09-21 05:46:35

这有助于避免创建大量不同的准备好的语句。

每个查询（准备好的语句）都需要进行解析，并且其执行计划需要为由数据库计算并缓存。此过程可能比实际执行已缓存语句的查询要昂贵得多。

大量不同的语句可能会导致将其他缓存的语句从缓存中清除，从而降低整体应用程序性能。

此外，由于硬解析通常非常昂贵，因此执行多个缓存的准备语句（包括多个数据库往返）通常比解析和执行新语句更快。因此，除了减少不同语句数量的明显好处之外，通过执行 11 个缓存语句来检索所有 119 个实体实际上可能比创建并执行包含所有 119 个 id 的单个新语句更快。

正如评论中已经提到的，Hibernate 调用 ArrayHelper.getBatchSizes 方法来确定给定最大批量大小的批量大小。

回复收藏 0 原文

爱格式化 2024-09-21 05:46:35

我在网上找不到任何关于hibernate如何处理批量加载的信息，但是从您的信息来看，人们可以猜测以下内容：

为什么

使用 11个批量加载器？批量大小为 20，如果您想最小化任意代理组合所需的加载器数量，基本上有两个选项：

为 1,2,3,4,5,6 创建一个加载器， 7,...20,21,22,23,... N 个未初始化的代理（愚蠢！）或者
为 1..9 之间的任意 N 创建一个加载器，然后为 batch_size/2（递归地）

示例：对于批量大小 40，您最终会得到 40,20,10,9,8,7,6,5,4,3,2,1 个装载机。

如果您有 33 个未初始化的代理，则可以使用以下加载器： 20, 10, 3
如果您有 119 个未初始化的代理，则可以使用以下加载器， 40(x2), 20, 10, 9
...

为什么批量加载器可以初始化：20、10、9、8、7、6、5、4、3、2、1 个代理？
我认为 hibernate 团队选择此作为加载“公共”数量 N 的未初始化代理所需的加载器数量与内存消耗之间的平衡。可以为 0 到 batch_size 之间的每个 N 创建一个加载程序，但我怀疑加载程序有相当大的内存占用所以这是一个权衡。算法可以是这样的（有根据的猜测）：