SQL Server 2005 中从小表批量复制到大表

发布于 2024-11-09 07:59:35 字数 494 浏览 9 评论 0原文

我是 SQL Server 的新手，遇到以下困境：

我有两个具有相同结构的表。将其命名为 runningTbl 和 finalTbl。

runningTbl 每 15 分钟包含大约 600 000 到 100 万行。

在 runningTbl 中进行一些数据清理后，我想将所有记录移至 finalTbl。 finalTbl 目前约有 3800 万行。

上述过程需要每15-20分钟重复一次。

问题是，将数据从 runningTbl 移动到 finalTbl 有时需要超过 20 分钟。

最初，当表很小时，需要 10 秒到2分钟复制。

现在只是需要太长的时间。

有谁可以帮忙解决这个问题吗？要遵循的 SQL 查询..

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

停顿的约定 2024-11-16 07:59:35

为了获得复制数据的最有效方法，您需要执行许多操作。到目前为止，您走在正确的道路上，但还有很长的路要走。我建议您首先查看您的索引。那里可能有一些优化可以提供帮助。接下来，确保此表上没有可能导致速度减慢的触发器。接下来，更改日志记录级别（如果可以更改）。

这里还有更多帮助（来自 Microsoft）：

http://msdn.microsoft.com/en-us/library/ms190421(v=SQL.90).aspx

基本上，您使用 BCP 的方向是正确的。这实际上是微软的建议：

要将数据从一个 SQL Server 实例批量复制到另一个实例，请使用 bcp 将表数据导出到数据文件中。然后使用批量导入方法之一将数据从文件导入到表中。使用本机或 Unicode 本机格式执行批量导出和批量导入操作。

不过，当您执行此操作时，您还需要考虑如果引入的数据过多（基于您使用的索引类型），则删除索引的可能性。如果您使用聚集索引，那么在导入之前对数据进行排序可能也是一个好主意。以下是更多信息（包括上述引用的来源）：

http://msdn.microsoft.com/en-US/library/ms177445(v=SQL.90).aspx

回复收藏 0 原文

风透绣罗衣 2024-11-16 07:59:35

对于初学者：多年来我学到的一件事是，MSSQL 在优化各种操作方面做得很好，但要做到这一点在很大程度上依赖于所有涉及的表的统计信息。因此，我建议运行“UPDATE STATISTICSprocessed_logs”&在运行实际插入之前“UPDATE STATISTICS unprocessed_logs”；即使在一张大桌子上，这些事情也不会花那么长时间。
除此之外，根据上面的查询，很大程度上取决于目标表的索引。我假设目标表在（至少）UnixTime 上有聚集索引（或主键），如果没有，当您在现有记录之间压缩越来越多的数据时，您将创建主要的数据碎片。要解决此问题，您可以尝试偶尔对目标表进行碎片整理（可以在线完成，但需要很长时间），但创建聚集索引（或 PK）以便数据始终附加到表的末尾是更好的方法；好吧，至少在我看来。

回复收藏 0 原文