当前位置：文江博客话题详情

修复数据完整性

发布于 2024-09-16 10:27:21 字数 289 浏览 6 评论 0原文

我认为这是一个不太可能的事情，但事情是这样的：

基本问题是：开发团队如何开始修复大型损坏数据集上的数据完整性？

我正在帮助的公司有一个巨大的 MySQL/PHP5 系统，多年来一直存在缺陷、无效数据、损坏的引用等。最重要的是，这些数据引用了一些在线服务的数据，例如 Google AdWords。

所以本地数据库有问题，本地和远程（例如AdWords）之间的关系也有问题，使问题变得更加复杂。

是否有人可以分享开始修复数据完整性的提示、技巧或最佳实践？并保持快速、持续添加和更新的系统中的数据完整性？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

意犹 2024-09-23 10:27:21

最大的问题是确定您打算对问题数据做什么：

没有
从其他地方保存的数据进行重建并且可以通过代码访问
重建数据手动
删除它（或者最好将其存档）

并且为了做到这一点，您需要确定问题数据如何影响系统/组织以及决议将如何影响系统/组织。

这是您的第一级分类。一旦掌握了这一点，您就需要开始识别特定问题，并从中导出一组定义错误模式的语义规则。

这样您就可以定义所需的修复、有效地确定工作的优先级并规划资源利用率。它还应该允许您确定优先级、计划并部分识别根本原因的消除。

我不确定你对“巨大”的定义是什么 - 但我推断这意味着有很多程序员为其做出贡献 - 在这种情况下，你肯定需要建立标准和程序来管理未来的数据完整性，正如您应该对性能和安全性所做的那样。

您定义的规则是持续数据管理的起点，但您应该考虑如何应用这些规则 - 向每个表添加时间戳字段/维护引用违反特定规则的行的表意味着您将“每次您想要检查数据时，不需要处理所有数据 - 只需处理自上次检查以来发生更改的内容 - 跟踪从违规列表中删除的案例以及那些案例是一个好主意正在添加。

请保留所应用的修复和相应规则违规的记录 - 并分析数据以识别重构可能会产生更易于维护的代码的热点。

回复收藏 0 原文

我乃一代侩神 2024-09-23 10:27:21

根据需求和存在的“损坏”程度，创建新数据库并修改应用程序以并行更新两者可能是明智的做法。

有效的数据可以导入到新的 d/b 中，然后一系列渐进的提取可以添加有效数据并导入这些数据，直到工作量增加到尝试恢复严重损坏的数据不再有意义为止。当然，一个未损坏的、不完整的数据库比一个损坏的数据库更好、更有用——只要它是损坏的，就不能称为“完整”。

回复收藏 0 原文

~没有更多了~

关于作者

薄荷梦

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

修复数据完整性

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

修复数据完整性

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者

留蓝

18790681156

zach7772

Wini

ayeshaaroy

初雪

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。