I. 教程
II. SQL 语言
III. 服务器管理
- 章14. 安装指导
- 章15. 在 Windows 上安装客户端
- 章16. 操作系统环境
- 章17. 服务器配置
- 章18. 数据库角色和权限
- 章19. 管理数据库
- 章21. 区域
- 章20. 用户认证
- 章22. 日常数据库维护工作
- 章23. 备份与恢复
- 章24. 高可用性与负载均衡
- 章25. 监控数据库的活动
- 章26. 监控磁盘使用情况
- 章27. 可靠性和预写式日志
- 章28. 回归测试
IV. 客户端接口
- Chapter 28. libpq - C 库
- 章29.
- Chapter 30. ecpg - 在 C 里嵌入 SQL
- Chapter 31. 信息模式
- 31.2. 数据类型
- 31.3. informationschemacatalog_name
- 31.4. applicable_roles
- 31.5. check_constraints
- 31.6. columndomainusage
- 31.7. column_privileges
- 31.8. columnudtusage
- 31.9. columns
- 31.10. constraintcolumnusage
- 31.11. constrainttableusage
- 31.12. datatypeprivileges
- 31.13. domain_constraints
- 31.14. domainudtusage
- 31.15. domains
- 31.16. element_types
- 31.17. enabled_roles
- 31.18. keycolumnusage
- 31.20. referential_constraints
- 31.21. rolecolumngrants
- 31.22. roleroutinegrants
- 31.23. roletablegrants
- 31.24. roleusagegrants
- 31.25. routine_privileges
- 31.26. routines
- 31.27. schemata
- 31.28. sql_features
- 31.29. sqlimplementationinfo
- 31.30. sql_languages
- 31.31. sql_packages
- 31.32. sql_sizing
- 31.33. sqlsizingprofiles
- 31.34. table_constraints
- 31.35. table_privileges
- 31.36. tables
- 31.37. triggers
- 31.38. usage_privileges
- 31.39. viewcolumnusage
- 31.40. viewtableusage
- 31.41. views
V. 服务器端编程
- 章33. 扩展 SQL
- 章34. 触发器
- 章35. 规则系统
- 章36. 过程语言
- 章37. PL/pgSQL - SQL 过程语言
- 章38. PL/Tcl - Tcl 过程语言
- 章39. PL/Perl - Perl 过程语言
- 章40. PL/Python - Python 过程语言
- 章41. 服务器编程接口
VI. 参考手册
- I. SQL 命令
- ABORT
- ALTER AGGREGATE
- ALTER CONVERSION
- ALTER DATABASE
- ALTER DOMAIN
- ALTER FUNCTION
- ALTER GROUP
- ALTER INDEX
- ALTER LANGUAGE
- ALTER OPERATOR
- ALTER OPERATOR CLASS
- ALTER ROLE
- ALTER SCHEMA
- ALTER SEQUENCE
- ALTER TABLE
- ALTER TABLESPACE
- ALTER TRIGGER
- ALTER TYPE
- ALTER USER
- ANALYZE
- BEGIN
- CHECKPOINT
- CLOSE
- CLUSTER
- COMMENT
- COMMIT PREPARED
- COMMIT
- COPY
- CREATE AGGREGATE
- CREATE CAST
- CREATE CONSTRAINT TRIGGER
- CREATE CONVERSION
- CREATE DATABASE
- CREATE DOMAIN
- CREATE FUNCTION
- CREATE GROUP
- CREATE INDEX
- CREATE LANGUAGE
- CREATE OPERATOR CLASS
- CREATE OPERATOR
- CREATE ROLE
- CREATE RULE
- CREATE SCHEMA
- CREATE SEQUENCE
- CREATE TABLE
- CREATE TABLE AS
- CREATE TABLESPACE
- CREATE TRIGGER
- CREATE TYPE
- CREATE USER
- CREATE VIEW
- DEALLOCATE
- DECLARE
- DELETE
- DROP OWNED
- DROP AGGREGATE
- DROP CAST
- DROP CONVERSION
- DROP DATABASE
- DROP DOMAIN
- DROP FUNCTION
- DROP GROUP
- DROP INDEX
- DROP LANGUAGE
- DROP OPERATOR CLASS
- DROP OPERATOR
- DROP ROLE
- DROP RULE
- DROP SCHEMA
- DROP SEQUENCE
- DROP TABLE
- DROP TABLESPACE
- DROP TRIGGER
- DROP TYPE
- DROP USER
- DROP VIEW
- END
- EXECUTE
- EXPLAIN
- FETCH
- GRANT
- INSERT
- LISTEN
- LOAD
- LOCK
- MOVE
- NOTIFY
- PREPARE TRANSACTION
- PREPARE
- REASSIGN OWNED
- REINDEX
- RELEASE SAVEPOINT
- RESET
- REVOKE
- ROLLBACK PREPARED
- ROLLBACK TO SAVEPOINT
- ROLLBACK
- SAVEPOINT
- SELECT
- SELECT INTO
- SET
- SET CONSTRAINTS
- SET ROLE
- SET SESSION AUTHORIZATION
- SET TRANSACTION
- SHOW
- START TRANSACTION
- TRUNCATE
- UNLISTEN
- UPDATE
- VACUUM
- II. PostgreSQL 客户端应用程序
- III. PostgreSQL 服务器应用程序
VII. 内部
- 章42. PostgreSQL 内部概貌
- 章43. 系统表
- 43.1. 概述
- 43.2. pg_aggregate
- 43.3. pg_am
- 43.4. pg_amop
- 43.5. pg_amproc
- 43.6. pg_attrdef
- 43.7. pg_attribute
- 43.8. pg_authid
- 43.9. pgauthmembers
- 43.10. pg_autovacuum
- 43.11. pg_cast
- 43.12. pg_class
- 43.13. pg_constraint
- 43.14. pg_conversion
- 43.15. pg_database
- 43.16. pg_depend
- 43.17. pg_description
- 43.18. pg_index
- 43.19. pg_inherits
- 43.20. pg_language
- 43.21. pg_largeobject
- 43.22. pg_listener
- 43.23. pg_namespace
- 43.24. pg_opclass
- 43.25. pg_operator
- 43.26. pg_pltemplate
- 43.27. pg_proc
- 43.28. pg_rewrite
- 43.29. pg_shdepend
- 43.30. pg_shdescription
- 43.31. pg_statistic
- 43.32. pg_tablespace
- 43.33. pg_trigger
- 43.34. pg_type
- 43.35. 系统视图
- 43.36. pg_cursors
- 43.37. pg_group
- 43.38. pg_indexes
- 43.39. pg_locks
- 43.40. pgpreparedstatements
- 43.41. pgpreparedxacts
- 43.42. pg_roles
- 43.43. pg_rules
- 43.44. pg_settings
- 43.45. pg_shadow
- 43.46. pg_stats
- 43.47. pg_tables
- 43.48. pgtimezoneabbrevs
- 43.49. pgtimezonenames
- 43.50. pg_user
- 43.51. pg_views
- 章44. 前/后端协议
- 章45. PostgreSQL 编码约定
- 章46. 本地语言支持
- 章47. 书写一个过程语言处理器
- 章48. 基因查询优化器
- 章49. 索引访问方法接口定义
- 章50. GiST 索引
- 章51. GIN 索引
- 章52. 数据库物理存储
- 章53. BKI 后端接口
- 章54. 规划器如何使用统计信息
VIII. 附录
pg_dump
名称
pg_dump--将一个数据库转储到一个脚本文件或者其它归档文件中语法
pg_dump
[option
...] [dbname
]
描述
pg_dump 是一个用于备份数据库的工具。它甚至可以在数据库正在使用的时候进行完整一致的备份。pg_dump 并不阻塞其它用户对数据库的访问(读或者写)。
转储格式可以是一个脚本或者归档文件。脚本转储的格式是纯文本,它包含许多 SQL 命令,这些 SQL 命令可以用于重建该数据库并将之恢复到保存成脚本的时候的状态。使用 psql 从这样的脚本中恢复。它们甚至可以用于在其它机器甚至是其它硬件体系的机器上重建该数据库,通过对脚本进行一些修改,甚至可以在其它 SQL 数据库产品上重建该数据库。
归档文件格式必须和 pg_restore 一起使用重建数据库。它们允许 pg_restore 对恢复什么东西进行选择,或者甚至是在恢复之前对需要恢复的条目进行重新排序。归档文件也是设计成可以跨平台移植的。
如果一种候选文件格式和 pg_restore 结合,那么 pg_dump 就能提供一种灵活的归档和传输机制。pg_dump 可以用于备份整个数据库,然后就可以使用 pg_restore 检查这个归档和/或选择要恢复的数据库部分。最灵活的输出文件格式是"custom"(自定义)格式(-Fc
)。它允许对归档元素进行选取和重新排列,并且缺省时是压缩的。tar 格式(-Ft
)不是压缩的并且在加载的时候不可能重排列,不过它也很灵活;还有,它可以用标准 Unix 工具(比如 tar
)进行处理。
在运行 pg_dump 的时候,应该检查输出,看看是否有任何警告存在(在标准错误上打印),特别是下面列出的限制。
选项
下面的命令行参数控制输出的内容和格式。
dbname
将要转储的数据库名。如果没有声明这个参数,那么使用环境变量
PGDATABASE
。如果那个环境变量也没声明,那么使用发起连接的用户名。-a
--data-only
只输出数据,不输出模式(数据定义)。
这个选项只是对纯文本格式有意义。对于归档格式,可以在调用
pg_restore
的时候声明该选项。-b
--blobs
在转储中包含大对象。除非指定了
--schema
,--table
,--schema-only
开关,否则这是默认行为。因此-b
开关仅用于在选择性转储的时候添加大对象。-c
--clean
输出在创建数据库创建命令之前先清理(drop)该数据库对象的命令。
这个选项只是对纯文本格式有意义。对于归档格式,可以在调用
pg_restore
的时候声明该选项。-C
--create
以一条创建该数据库本身并且与这个数据库连接命令开头进行输出。如果是这种形式的脚本,那么你在运行脚本之前和哪个数据库连接就不重要了。
这个选项只对纯文本格式有意义。对于归档格式,可以在调用
pg_restore
的时候声明该选项。-d
--inserts
将数据输出为的
INSERT
命令(而不是COPY
)。这样会导致恢复非常缓慢。这个选项主要用于制作那种可以用于其它非 PostgreSQL 数据库的转储。由于这个选项为每条记录都生成一条命令,因此如果其中某一行命令出错,那么将仅有该行数据丢失,而不是整个表的数据丢失。请注意,如果你重新排列了字段顺序,那么恢复可能会完全失败。-D
更安全,但是也更慢。-D
--column-inserts
--attribute-inserts
把数据转储为带有明确字段名的
INSERT
命令(INSERT INTO
)。这样会导致恢复非常缓慢,它主要用于制作那种可以用于其它非 PostgreSQL 数据库的转储。由于这个选项为每条记录都生成一条命令,因此如果其中某一行命令出错,那么将仅有该行数据丢失,而不是整个表的数据丢失。table
(column
, ...) VALUES ...-E
encoding
--encoding=
encoding
以指定的字符集编码创建转储。缺省时,转储是按照数据库编码创建的。另外一个获取同样结果的方法是将
PGCLIENTENCODING
环境变量设置为期望的转储编码。-f
file
--file=
file
把输出发往指定的文件。如果忽略,则使用标准输出。
-F
format
--format=
format
选择输出的格式。
format
可以是下列之一:p
plain
纯文本 SQL 脚本文件(缺省)
c
custom
适合输入到 pg_restore 里的自定义归档。这是最灵活的格式,它允许对加载的数据和对象定义进行重新排列。这个格式缺省的时候是压缩的。
t
tar
适合输入到 pg_restore 里的
tar
归档文件。使用这个归档允许在恢复数据库时重新排序和/或把数据库对象排除在外。同时也可以在恢复的时候限制对哪些数据进行恢复。
-i
--ignore-version
忽略在 pg_dump 和数据库服务器之间的版本差别。
pg_dump 可以处理来自以前版本的 PostgreSQL 数据库转储,但是太老的版本则不被支持了(目前是支持到 7.0)。但是 pg_dump 对于来自更新版本的转储则无法处理。仅在你需要跳过版本检查时才使用这个选项(而且如果 pg_dump 失效,别说我没警告过你)。
-n
schema
--schema=
schema
只转储匹配
schema
的模式内容,包括模式本身以及其中包含的对象。如果没有声明这个选项,所有目标数据库中的非系统模式都会被转储出来。可以使用多个-n
选项指定多个模式。同样,schema
参数将按照 psql 的\d
命令的规则(参见匹配模式)被解释为匹配模式,因此可以使用通配符匹配多个模式。在使用通配符的时候,最好用引号进行界定,以防止 shell 将通配符进行扩展。【注意】如果指定了
-n
,那么 pg_dump 将不会转储那些模式所依赖的其他数据库对象。因此,无法保证转储出来的内容一定能够在另一个干净的数据库中恢复成功。【注意】非模式对象(比如大对象)不会在指定
-n
的时候被转储出来。你可以使用--blobs
明确要求转储大对象。-N
schema
--exclude-schema=
schema
不转储任何匹配
schema
的模式内容。模式匹配规则与-n
完全相同。可以指定多个-N
以排除多种匹配的模式。如果同时指定了
-n
和-N
,那么将只转储匹配-n
但不匹配-N
的模式。如果出现-N
但是不出现-n
,那么匹配-N
的模式将不会被转储。-o
--oids
作为数据的一部分,为每个表都输出对象标识(OID)。如果你的应用需要 OID 字段的话(比如在外键约束中用到),那么使用这个选项。否则,不应该使用这个选项。
-O
--no-owner
不把对象的所有权设置为对应源数据库。pg_dump 默认发出
ALTER OWNER
或SET SESSION AUTHORIZATION
语句以设置创建的数据库对象的所有权。如果这些脚本将来没有被超级用户(或者拥有脚本中全部对象的用户)运行的话将会失败。-O
选项就是为了让该脚本可以被任何用户恢复并且将脚本中对象的所有权赋予该选项指定的用户。这个选项只是对纯文本格式有意义。对于归档格式,在调用
pg_restore
的时候可以声明该选项。-R
--no-reconnect
这个选项已经过时,但是出于向下兼容的考虑,仍然接受这个选项。
-s
--schema-only
只输出对象定义(模式),不输出数据。
-S
username
--superuser=
username
指定关闭触发器时需要用到的超级用户名。它只有使用了
--disable-triggers
的时候才有影响。一般情况下最好不要输入这个参数,而是用超级用户启动生成的脚本。-t
table
--table=
table
只转储出匹配
table
的表、视图、序列。可以使用多个-t
选项匹配多个表。同样,table
参数将按照 psql 的\d
命令的规则(参见匹配模式)被解释为匹配模式,因此可以使用通配符匹配多个模式。在使用通配符的时候,最好用引号进行界定,以防止 shell 将通配符进行扩展。使用了
-t
之后,-n
和-N
选项就失效了。因为被-t
选中的表将无视-n
和-N
选项而被转储,同时除了表之外的其他对象不会被转储。【注意】如果指定了
-t
,那么 pg_dump 将不会转储任何选中的表不依赖的其它数据库对象。因此,无法保证转储出来的表能在一个干净的数据库中成功恢复。【注意】
-t
选项与 PostgreSQL 8.2 之前的版本不兼容。之前的-t tab
将转储所有名为tab
的表,但是现在只转储在默认搜索路径中可见的表。写成-t '*.tab'
将等价于老版本的行为。同样,你必须用-t sch.tab
而不是老版本的-n sch -t tab
选择特定模式中的表。-T
table
--exclude-table=
table
不要转储任何匹配
table
模式的表。模式匹配规则与-t
完全相同。可以指定多个-T
以排除多种匹配的表。如果同时指定了
-t
和-T
,那么将只转储匹配-t
但不匹配-T
的表。如果出现-T
但是不出现-t
,那么匹配-T
的表将不会被转储。-v
--verbose
指定冗余模式。这样将令 pg_dump 输出详细的对象评注以及转储文件的启停时间和进度信息到标准错误上。
-x
--no-privileges
--no-acl
禁止转储访问权限(grant/revoke 命令)
--disable-dollar-quoting
这个选项关闭使用美元符界定函数体。强制它们用 SQL 标准的字符串语法的引号包围。
--disable-triggers
这个选项只是和创建仅有数据的转储相关。它告诉 pg_dump 包含在恢复数据时临时关闭目标表上触发器的命令。如果在表上有参照完整性检查或者其它触发器,而恢复数据的时候不想重载他们,那么就应该使用这个选项。
目前,为
--disable-triggers
发出的命令必须以超级用户来执行。因此,你应该同时用-S
声明一个超级用户名,或者最好是用一个超级用户的身份来启动这个生成的脚本。这个选项只对纯文本格式有意义。对于归档格式,可以在调用
pg_restore
的时候声明这个选项。--use-set-session-authorization
输出符合 SQL 标准的
SET SESSION AUTHORIZATION
命令而不是ALTER OWNER
命令。这样令转储更加符合标准,但是如果转储文件中的对象的历史有些问题,那么可能不能正确恢复。并且,使用SET SESSION AUTHORIZATION
的转储需要数据库超级用户的权限才能转储成功,而ALTER OWNER
需要的权限则低得多。-Z
0..9
--compress=
0..9
声明在那些支持压缩的格式中使用的压缩级别。目前只有自定义格式支持压缩。
下面的命令行参数控制数据库的连接参数。
-h
host
--host=
host
指定运行服务器的主机名。如果数值以斜杠开头,则被用作到 Unix 域套接字的路径。缺省从
PGHOST
环境变量中获取(如果设置了的话),否则,尝试一个 Unix 域套接字连接。-p
port
--port=
port
指定服务器正在侦听的 TCP 端口或本地 Unix 域套接字文件的扩展(描述符)。缺省使用
PGPORT
环境变量(如果设置了的话),否则,编译时的缺省值。-U
username
连接的用户名
-W
强制口令提示。如果服务器需要口令认证,那么这个动作应该自动发生。
环境变量
PGDATABASE
PGHOST
PGPORT
PGUSER
缺省连接参数
诊断
pg_dump 在内部使用 SELECT
语句。如果你运行 pg_dump 时碰到问题,确认你能够使用像 psql 这样的程序从数据库选取信息。
注意
如果你的数据库给 template1
数据库增加了任何你自己的东西,那么请注意把 pg_dump 的输出恢复到一个真正空的数据库中;否则你可能会收到因为重复定义所追加的对象而造成的错误信息。要制作一个没有任何本地附属物的数据库,可以从 template0
而不是 template1
拷贝,比如:
CREATE DATABASE foo WITH TEMPLATE template0;
pg_dump 有一些限制:
在进行纯数据转储并且使用了选项
--disable-triggers
的时候,pg_dump 发出一些查询先关闭用户表上的触发器,然后插入数据,插入完成后再打开触发器。如果恢复动作在中间停止,那么系统表可能就会处于一种错误状态。
tar 归档的成员的大小限制于 8 GB 。这是 tar 文件格式的固有限制。因此这个格式无法用于任何大小超过这个尺寸的表。tar 归档和任何其它输出格式的总大小是不受限制的,只是可能会有操作系统的限制。
pg_dump 生成的转储文件并不包含优化器用于查询规划决策的统计信息。因此,恢复完之后,建议在每个已恢复的对象上运行 ANALYZE
,以保证良好的性能。
因为 pg_dump 常用于向新版本的 PostgreSQL 中传递数据,所以 pg_dump 的输出可以被导入到新 PostgreSQL 数据库中。同时 pg_dump 还能读取旧 PostgreSQL 数据库的内容,但是一般无法读取更新的 PostgreSQL 数据库;同时也不能将新数据库中转储出来的内容恢复到旧版本中(硬要这样做可能需要手动修改转储结果)。
例子
将 mydb
数据库转储到一个 SQL 脚本文件:
$ pg_dump mydb > db.sql
将上述脚本导入一个(新建的)数据库 newdb
:
$ psql -d newdb -f db.sql
将数据库转储为自定义格式的归档文件:
$ pg_dump -Fc mydb > db.dump
将上述归档文件导入一个(新建的)数据库 newdb
:
$ pg_restore -d newdb db.dump
转储一个名为 mytab
的表:
$ pg_dump -t mytab mydb > db.sql
转储 detroit
模式中所有以 emp
开头的表,但是不包括 employee_log
表:
$ pg_dump -t 'detroit.emp*' -T detroit.employee_log mydb > db.sql
转储所有以 east
或 west
开头并以 gsm
结尾的模式,但是不包括名字中含有 test
的模式:
$ pg_dump -n 'east*gsm' -n 'west*gsm' -N '*test*' mydb > db.sql
同上,不过这一次使用正则表达式的方法:
$ pg_dump -n '(east|west)*gsm' -N '*test*' mydb > db.sql
转储所有数据库对象,但是不包括名字以 ts_
开头的表:
$ pg_dump -T 'ts_*' mydb > db.sql
在 -t
等选项中指定大写字母或大小写混合的名字必须用双引号界定,否则将被自动转换为小写(参见模式匹配)。但是因为双引号在 shell 中有特殊含义,所以必须将双引号再放进单引号中。这样一来,要转储一个大小写混合的表名,你就需要像下面这样:
$ pg_dump -t '"MixedCaseName"' mydb > mytab.sql
历史
pg_dump 工具最早出现在 Postgres95 0.02 版本。非纯文本输出格式在 PostgreSQL 7.1 时引入。
又见
pg_dumpall, pg_restore, psql, 环境变量(节29.12)如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论