比较两个不同数据库之间的大量数据的最佳方法是什么？

发布于 2024-10-19 05:52:11 字数 351 浏览 1 评论 0原文

我有一个桌面应用程序从 Web 服务接收数据并将其存储在本地 postgresql 数据库中（而 Web 服务从 SQL Server 数据库检索数据）。在此过程结束时，我的本地数据库中的表中将至少有 250 万个条目，但这些条目将从 de webservice 处分批接收，每次约 300 行，时间范围约为 15 天。

我需要一种方法来确保我的本地数据库具有与服务器数据库完全相同的信息。

我正在考虑为收到的每个批次创建某种校验和，然后在收到所有批次后，为整个表创建另一个校验和，但我不知道这是否是最佳解决方案，如果是，我不知道知道从哪里开始创建它。

PS：TCP已经处理完整性检查，所以我什至不知道是否需要这样做，但数据相同至关重要。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

尤怨 2024-10-26 05:52:11

我可以看到校验和如何可能有用，但是您所做的转换量可能会使其不切实际。您必须根据数据的原始形式或转换后的形式得出校验和；它对两者都无效。

你有一些奇怪的限制（我自己也经历过），所以在不了解所有细节的情况下很难想出一个清晰的策略。也许以下建议之一会起作用。

迁移完成后在 SQL Server 端和 PostgreSQL 端的简单 count(*)。
迁移完成后，从 SQL Server 端和 PostgreSQL 端转储出键列表，然后对这些文件进行排序和比较。
如果由于对 SQL Server 的访问受限而无法实现 1 和 2，则可以在进行过程中将 Web 服务调用的结果转储到单个文件位置，然后最后从 PostgreSQL 中提取相同的数据，并比较这些文件。

如果您选择选项 2 或 3，则有许多工具可用于比较文件。

回复收藏 0 原文