Postgresql PITR 备份：处理多个数据库的最佳实践？

发布于 2024-07-27 20:37:36 字数 988 浏览 8 评论 0原文

大家好，我有一个带有许多数据库的 postgresql 8.3 服务器。

实际上，我计划使用一个脚本来备份这些数据库，该脚本会将所有备份存储在与数据库同名的文件夹中，例如：

/mypath/backup/my_database1/
/mypath/backup/my_database2/
/mypath/backup/foo_database/

每天我每 2 小时进行 1 次转储，每天覆盖文件...例如，在 my_database1 文件夹中，我有：

my_database1.backup-00.sql  //backup made everyday at the 00.00 AM
my_database1.backup-02.sql  //backup made everyday at the 02.00 AM
my_database1.backup-04.sql  //backup made everyday at the 04.00 AM
my_database1.backup-06.sql  //backup made everyday at the 06.00 AM
my_database1.backup-08.sql  //backup made everyday at the 08.00 AM
my_database1.backup-10.sql  //backup made everyday at the 10.00 AM
[...and so on...]

这就是我实际上确保自己能够恢复丢失至少 2 小时数据的每个数据库的方式。

2个小时看起来还是太多了。

我查看了 postgresql pitr 的 WAL 文件，但是，这些文件似乎包含关于我的数据库的所有数据。

我需要分离这些文件，就像分离转储文件一样。

如何？

否则，还有另一个易于安装的备份程序，允许我仅恢复 10 秒前的 1 个备份，但无需每 10 秒创建一个转储文件？

原文

Hy guys, i have a postgresql 8.3 server with many database.

Actually, im planning to backup those db with a script that will store all the backup in a folder with the same name of the db, for example:

/mypath/backup/my_database1/
/mypath/backup/my_database2/
/mypath/backup/foo_database/

Every day i make 1 dump each 2 hours, overwriting the files every day... for example, in the my_database1 folder i have:

my_database1.backup-00.sql  //backup made everyday at the 00.00 AM
my_database1.backup-02.sql  //backup made everyday at the 02.00 AM
my_database1.backup-04.sql  //backup made everyday at the 04.00 AM
my_database1.backup-06.sql  //backup made everyday at the 06.00 AM
my_database1.backup-08.sql  //backup made everyday at the 08.00 AM
my_database1.backup-10.sql  //backup made everyday at the 10.00 AM
[...and so on...]

This is how i actually assure myself to be able to restore everydatabase loosing at least 2 hours of data.

2 hours still looks too much.

I've got a look to the postgresql pitr trought the WAL files, but, those files seem to contain all the data about all my database.

I'll need to separate those files, in the same way i do separate the dump files.

How to?

Otherwise, there is another easy-to-install to have a backup procedure that allo me to restore just 1 backup at 10 seconds earlier, but without creating a dump file every 10 seconds?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

烟燃烟灭 2024-08-03 20:37:36

对于一个 PostgresSQL 实例来说这是不可能的。

您可以将 500 个表划分为多个实例，每个实例监听不同的端口，但这意味着它们不会有效地使用内存等资源（在一个实例中保留但未使用的内存不能被另一个实例使用）。

Slony 在这里也不起作用，因为它不复制 DDL 语句，例如删除表。

我建议同时执行这两项操作：

继续进行 pg_dump 备份，但尝试使其平滑 - 限制 pg_dump io 带宽，这样它就不会损坏服务器，并连续运行它 - 当它完成最后一个数据库时，然后立即从第一个开始；
另外设置PITR。

通过这种方式，您可以快速恢复单个数据库，但可能会丢失一些数据。如果您决定无法承受丢失那么多数据，那么您可以将 PITR 备份恢复到临时位置（使用 fsync=off 并将 pg_xlog 符号链接到 ramdisk 以提高速度），从那里 pg_dump 受影响的数据库并将其恢复到您的主数据库数据库。

回复收藏 0 原文