当前位置：文江博客话题详情

反转（或撤消）仓库事实表的大量负载

发布于 2024-07-11 22:07:21 字数 482 浏览 4 评论 0原文

目前，我们计划为加载的每批事实记录一个“批次 ID”。这样，我们就可以在发现问题时取消负载。

我们是否应该考虑跟踪维度行上的批次 ID？

看起来维度行有不同的规则。如果我们将它们视为缓慢变化，并使用一种保留历史记录的 SCD 算法，那么重新加载并没有多大意义。

典型场景。符合尺寸，处理SCD。加载事实。完毕。

扩大。符合尺寸，处理SCD。加载事实。发现问题。删除该批事实。解决问题。重新加载事实。完毕。

可能的情况。符合尺寸，处理SCD。加载事实。发现问题。删除该批事实和维度行。解决问题。符合尺寸，处理SCD。加载事实。完毕。

跟踪尺寸变化似乎没有多大帮助。有关如何最好地处理数据仓库负载的“撤消”或“回滚”的任何指导？

我们的 ETL 工具完全是自制的 Python 应用程序。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

Saygoodbye 2024-07-18 22:07:21

从我的角度来看，只要您不滥用维度（例如跟踪时间到毫秒），通过跟踪回滚维度就不会获得太多收益。您还可以构建一个工具来每月清理一次未引用的维度。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待＂谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文