当前位置：文江博客话题详情

如何将清理后的原始数据存储在数据库中？

发布于 2024-11-05 13:21:47 字数 122 浏览 5 评论 0原文

原始数据存储在数据库（多个表）中。需要人工检查并修正。检查后的数据应与原始数据一起存储在数据库中。在这种情况下，创建两个单独的数据库（例如 raw_data 和checked_data）是个好主意吗？或者应该只有一个数据库？谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

离不开的别离 2024-11-12 13:21:47

一般来说，在单个实例中工作比在多个实例中工作要容易得多。分布式事务执行速度较慢。它们需要更多的输入（总是需要添加数据库链接）。这不仅是方便的问题，也是诚信的问题。您可能希望确保给定记录位于 RAW 数据集或 CLEANSED 数据集中，但不能同时位于两者中。在单个数据库中检查此类事情更容易管理。

如何在单个数据库中组织事物在某种程度上取决于您选择的 DBMS 风格及其支持的内容。您可以拥有单个架构（用户帐户）并使用命名约定（例如前缀），例如 RAW_TABLE_1 和 CLEAN_TABLE_1。或者您可能想要使用不同的架构，这将允许您保留相同的表名称，例如 RAW_USER.TABLE_1 和 CLEAN_USER.TABLE_1。两种方法各有优点。不断提醒我们使用的是原始数据还是干净数据总是好的。另一方面，我们可能希望使用期望正常表名称的工具或应用程序。同义词在这方面可以提供帮助。

回复收藏 0 原文