当前位置：文江博客话题详情

insert-select 语句很大吗？

发布于 2024-10-19 00:56:02 字数 94 浏览 1 评论 0原文

当在事务中使用 select 语句进行多次插入时，数据库如何跟踪事务期间的更改？如果事务保持打开时间过长，资源（例如内存或硬盘空间）是否会出现问题？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

屌丝范 2024-10-26 00:56:02

简而言之，这取决于选择的大小。从技术上讲，选择是事务的一部分，但大多数选择不必“回滚”，因此数据库更改的实际日志不会包含选择本身。它将包含作为插入语句的 select 语句的每个结果的一个新行。如果该 select 语句有 10k 行，则提交将相当大，但不会比您在显式事务中编写 10k 条单独的 insert 语句更大。

回复收藏 0 原文

若相惜即相离 2024-10-26 00:56:02

具体如何工作取决于数据库。例如，在 Oracle 中，它将需要 UNDO 空间（最终，如果你用完，你的事务将被中止，或者你的 DBA 会对你大喊大叫）。在 PostgreSQL 中，它将阻止旧行版本的清理。在MySQL/InnoDB中，它会使用回滚空间，并可能导致锁定超时。

数据库必须使用空间来完成以下几件事：

存储事务已更改的行（旧值、新值或两者），以便可以执行回滚
跟踪哪些数据对事务可见，以便保持一致维护视图（在除未提交读之外的事务隔离级别中）。您请求的隔离程度越高，这种开销通常会越大。
跟踪哪些数据对其他事务可见（除非整个数据库以未提交读的方式运行）
跟踪事务更改了哪些对象，因此遵循隔离规则，尤其是在可序列化隔离中。（可能空间不大，但有足够的锁）。

一般来说，您希望尽快提交事务。因此，例如，您不想在空闲连接上保持打开状态。如何最好地进行批量插入取决于数据库（通常，一个事务上的许多插入比每次插入一个事务要好）。当然，交易的主要目的是数据完整性。

回复收藏 0 原文

萧瑟寒风 2024-10-26 00:56:02

大额交易可能会遇到很多问题。首先，在大多数数据库中，您不希望逐行运行，因为对于一百万条记录，这将需要几个小时。但是，在一个复杂的语句中插入一百万条记录可能会导致所涉及的表被锁定，并损害其他人的性能。如果终止事务，回滚也可能需要一段时间。通常最好的选择是批量循环。我通常一次测试 50,000 个，然后根据需要的时间来提高或降低设置。我有一些数据库，在一次基于集合的操作中执行的操作不超过 1000 个。如果可能，大型插入或更新应安排在数据库运行的非高峰时段。如果非常大（并且是一次性的 - 通常是大型数据迁移），您甚至可能需要关闭数据库进行维护，将其置于单用户模式并删除索引，执行插入和重新索引。

回复收藏 0 原文

~没有更多了~