刷新报告数据库

发布于 2024-09-25 17:24:11 字数 170 浏览 12 评论 0原文

目前，我们的项目有一个 OLTP sql server 2005 数据库。我们计划构建一个单独的报告数据库（非规范化），以便我们可以减轻 OLTP 数据库的负载。我不太确定同步这些数据库的最佳方法是什么。不过，我们并不是在寻找实时系统。 SSIS 是一个好的选择吗？我对 SSIS 完全陌生，所以不确定可行性。请提供您的意见。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

放我走吧 2024-10-02 17:24:11

每个人对SSIS都有自己的看法。但我多年来一直将它用于数据集市和我当前的环境，这是一个完整的 BI 安装。我个人很喜欢它移动数据的能力，并且它仍然保持着在 30 分钟内移动 1.13 TB 的世界纪录。

至于设置，我们使用事务数据库中的日志传送来填充第二个框。然后使用SSIS对数据进行反规范化和入库。 SSIS 社区也非常大，并且有大量免费培训和有用的在线资源。

回复收藏 0 原文

兮颜 2024-10-02 17:24:11

我们使用 SSIS 构建数据仓库，并从中运行报告。它是一个很大的学习曲线，它抛出的错误并不是特别有用，它有助于擅长 SQL，而不是将其视为“逐行传输”——我的意思是你应该在中创建基于集合的查询sql 命令任务而不是使用大量 SSIS 组件和数据流任务。

了解每个仓库都是不同的，您需要决定如何做到最好。此链接可能会给您一些好主意。

我们如何实现我们的（我们有一个 postgres 后端并使用 PGNP 提供程序，并且使用链接服务器可以让您的生活更轻松）：

首先，您需要在每个表中都有一个时间戳列，以便您可以在最后一次查看时改变了。

然后编写一个查询，选择自上次运行包以来已更改的数据（使用审核表会有所帮助）并将该数据放入临时表中。我们将其作为数据流任务运行，因为（使用 postgres）我们没有任何其他选择，尽管您可以使用对另一个数据库的正常引用（dbname.schemaname.tablename 或类似的东西）或使用链接服务器查询。无论哪种方式，想法都是一样的。您最终会得到自查询以来发生变化的数据。

然后我们更新（基于id）已经存在的数据，然后插入新数据（通过左连接表来找出当前仓库中尚不存在的数据）。

现在我们有一个非规范化的表，在本例中显示每天的工作情况。由此，我们根据该表的聚合值计算其他表。

希望有所帮助，这里有一些我发现有用的好链接：