如何为生产网站中的数据丢失做好准备？

发布于 2024-11-06 09:37:44 字数 682 浏览 8 评论 0原文

我正在构建一个正在快速投入生产的应用程序，我担心由于黑客攻击，可能会出现一些愚蠢的个人错误（例如运行 rake db:schema:load 或 rake db:回滚）或其他情况下我们可能会遭受一个数据库表甚至整个系统的数据丢失。

虽然我认为上述情况不太可能发生，但如果没有做好万一发生的准备，那就太失职了。

我正在使用 Heroku 的 PG 备份（本月将被其他东西取代），并且我还运行自动每日备份到 S3：http://trevorturk.com/2010/04/14/automated-heroku-backups/，成功生成.dump 文件。

处理生产应用程序中的数据丢失的正确方法是什么？

如果需要，我将如何恢复 .dump 文件？如果系统的一小部分受到攻击，我可以进行选择性恢复吗？
如果无法进行选择性恢复：假设一个表在上次备份后 4 小时丢失了数据。结果=>修复丢失的表需要回滚 4 小时的用户活动吗？对此有什么好的解决办法吗？
如果发生此类情况，为用户带来不便提供支持的最佳方式是什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

预谋 2024-11-13 09:37:44

完整的 DR（灾难恢复）解决方案需要满足以下条件：

多站点。如果火灾、洪水、乌萨马·本·拉登或其他什么袭击了 Heroku 使用的 Amazon（或者是 Salesforce？）数据中心，您需要确保您的数据在其他地方是安全的。
持续将数据复制到单独的站点（或多个站点）。这意味着写入一个站点上的数据库的每个事务都会在几秒钟内复制到另一个站点上的镜像数据库。大多数 RDBMS 都有让您执行类似主从复制的机制。
这同样适用于您放在数据库外部的文件系统上的任何内容，例如图像、XML 配置文件等。S3 是一个很好的解决方案 - 它们为您将所有内容复制到多个数据中心。
我不会伤害创建数据库的定期（每天左右）转储并单独存储它们（例如在 S3 上）。这可以帮助您从传播到从属数据库的数据损坏中恢复。
自动化数据恢复过程。您希望它在您需要时发挥作用。
测试一切。理想情况下，您希望自动化测试过程并定期运行它以确保您的备份可以恢复。 Netflix Chaos Monkey 就是一个极端的例子的这个。

我不确定你如何在 Heroku 上实现这一切。对于大多数公司来说，完整的解决方案的价格仍然遥不可及——我们在自己的数据中心（一个在美国，一个在欧盟）运行这个解决方案，成本高达数百万美元。按照 80-20 规则进行工作 - 持续备份到单独的站点，加上经过充分测试的恢复计划（不断测试您从备份中恢复的能力）涵盖了您所需的 80%。

对于支持用户来说，最好的解决方案就是在出现问题时及时、如实地沟通，并确保不会丢失任何数据。如果您的用户为您的服务付费（即您不受广告支持），那么您可能应该制定 SLA。