执行语句是否总是占用内存来存储结果集？

发布于 2024-10-01 15:13:56 字数 334 浏览 11 评论 0原文

一位同事告诉我，执行 SQL 语句总是由数据库服务器将数据放入 RAM/交换区。因此选择大型结果集是不切实际的。

我认为这样的代码

my $sth = $dbh->prepare('SELECT million_rows FROM table');
while (my @data = $sth->fetchrow) {
    # process the row
}

会逐行检索结果集，而不会将其加载到 RAM 中。但我在 DBI 或 MySQL 文档中找不到任何对此的引用。结果集是如何真正创建和检索的？对于简单的选择和连接来说，它的工作方式是否相同？

原文

I was told by a colleague that executing an SQL statement always puts the data into RAM/swap by the database server. Thus it is not practical to select large result sets.

I thought that such code

my $sth = $dbh->prepare('SELECT million_rows FROM table');
while (my @data = $sth->fetchrow) {
    # process the row
}

retrieves the result set row by row, without it being loaded to RAM.
But I can't find any reference to this in DBI or MySQL docs. How is the result set really created and retrieved? Does it work the same for simple selects and joins?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

被翻牌 2024-10-08 15:13:56

你的同事是对的。

默认情况下，perl 模块 DBD::mysql 使用 mysql_store_result，它确实读取所有 SELECT 数据并将其缓存在 RAM 中。除非您更改默认值，否则当您在 DBI 中逐行获取时，它只是从内存缓冲区中读取它们。

这通常是您想要的，除非您有非常非常大的结果集。否则，在您从 mysqld 获取最后一个数据之前，它必须保持该数据准备就绪，我的理解是，它会导致对相同行的写入阻塞（块？表？）。

请记住，现代机器拥有大量 RAM。百万行结果集通常没什么大不了的。即使每行非常大（1 KB），也只需要 1 GB RAM 加上开销。

如果您要处理数百万行 BLOB，也许您确实需要 mysql_use_result，或者您希望通过逐步使用 LIMIT x,y 来分块选择这些行。

有关详细信息，请参阅 perldoc DBD::mysql 中的 mysql_use_result 和 mysql_store_result。

回复收藏 0 原文

时光病人 2024-10-08 15:13:56

这是不正确的（如果我们谈论的是数据库服务器本身，而不是客户端层）。

MySQL 可以缓冲整个结果集，但这并不是一定要做的，而且如果做了，也不一定在 RAM 中。

如果您使用内联视图 (SELECT FROM (SELECT …))、查询需要排序（显示为 using filesort）或计划，结果集将被缓冲需要创建临时表（在查询计划中显示为 using tempor）。

即使使用临时，MySQL也只会在其大小不超过tmp_table中设置的限制时将表保留在内存中。当表增长超过此限制时，它将从内存转换为MyISAM并存储在磁盘上。

不过，您可以通过将 SQL_BUFFER_RESULT 指令附加到最外层的 SELECT 来显式指示 MySQL 缓冲结果集。

请参阅文档更多细节。

回复收藏 0 原文

╄→承喏 2024-10-08 15:13:56

不，事情不是这样的。

数据库不会在 RAM/交换区中保存行。

然而，它会尝试，并且 mysql 在这里努力尝试，尽可能多地缓存（索引、结果等......）。您的 mysql 配置为不同类型的缓存（针对不同类型的存储引擎）提供了可用内存缓冲区的值 - 您不应该允许此缓存交换。

测试一下
底线-仅使用客户端测试它应该很容易（我不知道perl的dbi，它可能，但我怀疑它，正在做一些强制mysql在准备时加载所有内容的事情）。无论如何...测试一下：

如果您实际上在 SELECT SQL_NO_CACHE Million_rows FROM table 上发出准备，然后仅从数百万行中获取几行。
然后，您应该将性能与SELECT SQL_NO_CACHE only_fetched_rows FROM table进行比较，看看效果如何。
如果性能相当（并且速度很快），那么我相信您可以揭穿您同事的虚张声势。

另外，如果您启用实际发送到 mysql 的语句的日志，并给我们一份记录，那么我们（非 perl 人员）可以就 mysql 的作用给出更明确的答案。