当前位置：文江博客话题详情

处理数据库记录时如何估计适当的批量大小数

发布于 2024-10-14 14:45:15 字数 314 浏览 3 评论 0原文

假设我有一个处理器，它从一个表转换中获取记录并将它们放入另一个表中。我正在尝试计算可以一次加载到内存中并处理多少条记录。

显然，这取决于很多因素：记录中的数据量、任何 BLOBS？、列数、数据库类型、驱动程序、框架、盒子上有多少可用内存、是否有任何其他内存消耗进程在运行相同的环境等。

表单测试我可以看到它能够一次处理 10000 条记录，但无法（OOM）查询 100000 条记录。

我想我正在寻找一个好的策略来找出适当的批量大小数字。

或者我应该选择一个非常保守且低批量大小的数字，例如 100。并且不用担心任何查询开销。

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

疯狂的代价 2024-10-21 14:45:15

我会进行不同规模的测试，直到你看不到任何改进。你可能会看到类似的东西。

1 : 10 ms
10 : 5 ms each
100 : 3.5 ms each
1K : 3 ms each.
10K : 3.2 ms each.

在这种情况下，我会选择 1K 或 100 偏低。

I would perform tests of different sizes until you don't see any improvement. You might see something like.

1 : 10 ms
10 : 5 ms each
100 : 3.5 ms each
1K : 3 ms each.
10K : 3.2 ms each.

In which case I would pick 1K or 100 to be on the low side.

回复收藏 0 原文

倚栏听风 2024-10-21 14:45:15

使值可手动配置，并运行一些基准测试。将值设置为合理的数字。我发现过去随着批量记录数量的增加，性能的提高变得越来越少。因此，性能从一次 1 条记录跃升至 10 条是戏剧性的，而从 10 条记录跃升到 100 条记录的情况则不太明显，从 100 条记录跃升到 1000 条记录的情况则更不明显，依此类推。

因此，我会运行基准测试来找出合理的，然后将其保留为可配置的，你永远不知道何时需要出于某种奇怪的原因调整它。

回复收藏 0 原文

~没有更多了~