返回介绍

I. 教程

II. SQL 语言

III. 服务器管理

IV. 客户端接口

V. 服务器端编程

VI. 参考手册

VII. 内部

VIII. 附录

17.5. 预写式日志

发布于 2019-09-30 03:07:13 字数 4600 浏览 917 评论 0 收藏 0

又见节27.3获取 WAL 调节的细节。

17.5.1. Settings

fsync (boolean)

如果打开这个选项,那么 PostgreSQL 服务器将在好几个地方使用 fsync() 系统调用(或等价调用,参见 wal_sync_method)来确保更新已经物理上写到磁盘中。这样就保证了数据库集群将在操作系统或者硬件崩溃的情况下恢复到一个一致的状态。

不过,使用 fsync 会对性能有影响:在事务提交的时候,PostgreSQL 必须等待操作系统把预写日志刷新到磁盘上。在关闭 fsync 的时候,操作系统可以尽可能优化缓冲、排序和推迟写动作。这样可以显著提高性能。不过,如果系统崩溃,最后提交的几个事务的结果可能部分或者全部丢失。最糟糕的情况是可能出现不可恢复的崩溃。数据库服务器本身崩溃并不是这里的风险因素。只有操作系统级别的崩溃才会导致毁坏数据的风险。

因为涉及的风险太高,fsync 的设置没有普适的原则。有些管理员总是关闭 fsync ,而其它一些只是在批量装载的时候关闭它,因为这个时候,即使出现了错误,也有明确重新开始的点,而另外一些管理员总是打开 fsync 。缺省是打开 fsync ,目的是最大限度的可靠性。如果你信任操作系统、硬件、工具、备份电池,你可以考虑关闭 fsync

这个选项只能在服务器启动的时候或者在 postgresql.conf 文件里设置。如果这个选项被关闭,那么请考虑把 full_page_writes 也关闭了。

wal_sync_method (string)

用来向磁盘强制更新 WAL 数据的方法。如果 fsync 是关闭的,那么这个设置就没有意义,因为所有更新都不会强制输出。可能的值是:

  • open_datasync(用带 O_DSYNC 选项的 open() 打开 WAL 文件)

  • fdatasync(每次提交的时候都调用 fdatasync())

  • fsync_writethrough(每次提交的时候调用 fsync() 强制写出任何磁盘写缓冲区)

  • fsync(每次提交的时候调用 fsync())

  • open_sync(用带 O_SYNC 选项的 open() 写 WAL 文件)

不是在所有系统上都能使用上面四种选项。缺省是被支持的最前面一个选项。这个选项只能在服务器启动的时候或者在 postgresql.conf 文件里设置。

full_page_writes (boolean)

打开这个选项的时候,PostgreSQL 服务器在检查点之后对页面的第一次写入时将整个页面写到 WAL 里面。这么做是因为在操作系统崩溃过程中可能只有部分页面写入磁盘,从而导致在同一个页面中包含新旧数据的混合。在崩溃后的恢复期间,由于在 WAL 里面存储的行变化信息不够完整,因此无法完全恢复该页。把完整的页面影像保存下来就可以保证正确存储页面,代价是增加了写入 WAL 的数据量。因为 WAL 重放总是从一个检查点开始的,所以在检查点后每个页面第一次改变的时候做 WAL 备份就足够了。因此,一个减小全页面写开销的方法是增加检查点的间隔参数值。

把这个选项关闭会加快正常操作的速度,但是可能导致系统崩溃或者掉电之后的数据库损坏,它的危害类似 fsync ,只是比较小而已。如果你有减小部分页面写入风险的硬件支持(比如电池供电的磁盘控制器),或者文件系统支持(比如 ReiserFS 4),并且他们可以把风险降低到一个可以接受的低范畴,那么你可以关闭这个选项。

关闭这个选项并不影响即时恢复(PITR)的 WAL 使用(参阅节23.3)。

这个选项只能在服务器启动的时候或者在 postgresql.conf 文件里设置。缺省是 on

wal_buffers (integer)

放在共享内存里用于 WAL 数据的磁盘页面缓冲区的数目。缺省值为 8 。这个设置只需要大到能保存下一次事务生成的 WAL 数据即可,因为这些数据在每次事务提交时都会写入磁盘。这个值只能在服务器启动的时候设置。

增大这个参数可能导致 PostgreSQL 要求更多的 System V 共享内存,可能超过操作系统的缺省配置。必要时,参阅节16.4.1获取如何调节这些参数的信息。

commit_delay (integer)

向 WAL 缓冲区写入记录和将缓冲区刷新到磁盘上之间的时间延迟,以微秒计。非零的延迟允许多个事务共用一个 fsync() 系统调用提交,如果系统负载足够高,那么在给出的间隔里,其它的事务可能已经准备好提交了。但是如果没有其它事务准备提交,那么这个间隔就是在浪费时间。因此,这个延迟只是在一个服务器进程写其提交日志时,至少 commit_siblings 个其它事务在活跃的情况下执行。缺省是零(无延迟)。

commit_siblings (integer)

在执行 commit_delay 延迟的时候,要求最少同时打开的并发事务数目。大一些的数值会导致在延迟期间另外一个事务准备好提交的可能性增大。缺省是 5 。

17.5.2. 检查点

checkpoint_segments (integer)

在自动的 WAL 检查点之间的最大距离,以日志文件段计(通常每个段 16MB)。缺省是 3 。这个选项只能在服务器启动的时候或者在 postgresql.conf 文件里设置。

checkpoint_timeout (integer)

在自动 WAL 检查点之间的最长时间,以秒计。缺省是 300 秒。这个选项只能在服务器启动的时候或者在 postgresql.conf 文件里设置。

checkpoint_warning (integer)

如果由于填充检查点段文件导致的检查点发生时间间隔接近这个参数表示的秒数,那么就向服务器日志发送一个建议增加 checkpoint_segments 值的消息。缺省是 30 秒。零则关闭警告。这个选项只能在服务器启动的时候或者在 postgresql.conf 文件里设置。

17.5.3. 归档

archive_command (string)

将一个完整的 WAL 文件序列归档的 shell 命令。如果这是一个空字符串(缺省),那么就关闭 WAL 归档。字符串中任何 %p 都被要归档的文件的绝对路径代替,而任何 %f 都只被该文件名代替(非绝对路径都相对于集群的数据目录)。如果你需要在命令里嵌入 % 字符就必须双写(%%)。有关更多的信息,参阅节23.3.1。这个选项只能在服务器启动的时候或者在 postgresql.conf 文件里设置。

有一点很重要:这个命令必须是当且仅当成功的时候才返回零。比如:

archive_command = 'cp "%p" /mnt/server/archivedir/"%f"'
archive_command = 'copy "%p" /mnt/server/archivedir/"%f"'  # Windows
archive_timeout (integer)

archive_command 仅在已完成的 WAL 段上调用。因此,如果服务器只产生很少的 WAL 流量(或产生流量的周期很长),那么在完成事务以及安全归档存储之间将有一个很长的延时。为了限制未归档数据的逗留时间,你可以强制服务器以 archive_timeout 指定的秒数为周期切换到新的 WAL 段文件。该参数等于零表示关闭此特性。注意,由于强制切换而提早关闭的归档文件仍然与完整的归档文件长度相同。因此,将 archive_timeout 设为很小的值是不明智的,它将导致占用巨大的归档存储空间。将 archive_timeout 设置为 60 秒左右是比较合理的。这个选项只能在服务器启动的时候或者在 postgresql.conf 文件里设置。

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文