I. 教程
II. SQL 语言
III. 服务器管理
- 章14. 安装指导
- 章15. 在 Windows 上安装客户端
- 章16. 操作系统环境
- 章17. 服务器配置
- 章18. 数据库角色和权限
- 章19. 管理数据库
- 章21. 区域
- 章20. 用户认证
- 章22. 日常数据库维护工作
- 章23. 备份与恢复
- 章24. 高可用性与负载均衡
- 章25. 监控数据库的活动
- 章26. 监控磁盘使用情况
- 章27. 可靠性和预写式日志
- 章28. 回归测试
IV. 客户端接口
- Chapter 28. libpq - C 库
- 章29.
- Chapter 30. ecpg - 在 C 里嵌入 SQL
- Chapter 31. 信息模式
- 31.2. 数据类型
- 31.3. informationschemacatalog_name
- 31.4. applicable_roles
- 31.5. check_constraints
- 31.6. columndomainusage
- 31.7. column_privileges
- 31.8. columnudtusage
- 31.9. columns
- 31.10. constraintcolumnusage
- 31.11. constrainttableusage
- 31.12. datatypeprivileges
- 31.13. domain_constraints
- 31.14. domainudtusage
- 31.15. domains
- 31.16. element_types
- 31.17. enabled_roles
- 31.18. keycolumnusage
- 31.20. referential_constraints
- 31.21. rolecolumngrants
- 31.22. roleroutinegrants
- 31.23. roletablegrants
- 31.24. roleusagegrants
- 31.25. routine_privileges
- 31.26. routines
- 31.27. schemata
- 31.28. sql_features
- 31.29. sqlimplementationinfo
- 31.30. sql_languages
- 31.31. sql_packages
- 31.32. sql_sizing
- 31.33. sqlsizingprofiles
- 31.34. table_constraints
- 31.35. table_privileges
- 31.36. tables
- 31.37. triggers
- 31.38. usage_privileges
- 31.39. viewcolumnusage
- 31.40. viewtableusage
- 31.41. views
V. 服务器端编程
- 章33. 扩展 SQL
- 章34. 触发器
- 章35. 规则系统
- 章36. 过程语言
- 章37. PL/pgSQL - SQL 过程语言
- 章38. PL/Tcl - Tcl 过程语言
- 章39. PL/Perl - Perl 过程语言
- 章40. PL/Python - Python 过程语言
- 章41. 服务器编程接口
VI. 参考手册
- I. SQL 命令
- ABORT
- ALTER AGGREGATE
- ALTER CONVERSION
- ALTER DATABASE
- ALTER DOMAIN
- ALTER FUNCTION
- ALTER GROUP
- ALTER INDEX
- ALTER LANGUAGE
- ALTER OPERATOR
- ALTER OPERATOR CLASS
- ALTER ROLE
- ALTER SCHEMA
- ALTER SEQUENCE
- ALTER TABLE
- ALTER TABLESPACE
- ALTER TRIGGER
- ALTER TYPE
- ALTER USER
- ANALYZE
- BEGIN
- CHECKPOINT
- CLOSE
- CLUSTER
- COMMENT
- COMMIT PREPARED
- COMMIT
- COPY
- CREATE AGGREGATE
- CREATE CAST
- CREATE CONSTRAINT TRIGGER
- CREATE CONVERSION
- CREATE DATABASE
- CREATE DOMAIN
- CREATE FUNCTION
- CREATE GROUP
- CREATE INDEX
- CREATE LANGUAGE
- CREATE OPERATOR CLASS
- CREATE OPERATOR
- CREATE ROLE
- CREATE RULE
- CREATE SCHEMA
- CREATE SEQUENCE
- CREATE TABLE
- CREATE TABLE AS
- CREATE TABLESPACE
- CREATE TRIGGER
- CREATE TYPE
- CREATE USER
- CREATE VIEW
- DEALLOCATE
- DECLARE
- DELETE
- DROP OWNED
- DROP AGGREGATE
- DROP CAST
- DROP CONVERSION
- DROP DATABASE
- DROP DOMAIN
- DROP FUNCTION
- DROP GROUP
- DROP INDEX
- DROP LANGUAGE
- DROP OPERATOR CLASS
- DROP OPERATOR
- DROP ROLE
- DROP RULE
- DROP SCHEMA
- DROP SEQUENCE
- DROP TABLE
- DROP TABLESPACE
- DROP TRIGGER
- DROP TYPE
- DROP USER
- DROP VIEW
- END
- EXECUTE
- EXPLAIN
- FETCH
- GRANT
- INSERT
- LISTEN
- LOAD
- LOCK
- MOVE
- NOTIFY
- PREPARE TRANSACTION
- PREPARE
- REASSIGN OWNED
- REINDEX
- RELEASE SAVEPOINT
- RESET
- REVOKE
- ROLLBACK PREPARED
- ROLLBACK TO SAVEPOINT
- ROLLBACK
- SAVEPOINT
- SELECT
- SELECT INTO
- SET
- SET CONSTRAINTS
- SET ROLE
- SET SESSION AUTHORIZATION
- SET TRANSACTION
- SHOW
- START TRANSACTION
- TRUNCATE
- UNLISTEN
- UPDATE
- VACUUM
- II. PostgreSQL 客户端应用程序
- III. PostgreSQL 服务器应用程序
VII. 内部
- 章42. PostgreSQL 内部概貌
- 章43. 系统表
- 43.1. 概述
- 43.2. pg_aggregate
- 43.3. pg_am
- 43.4. pg_amop
- 43.5. pg_amproc
- 43.6. pg_attrdef
- 43.7. pg_attribute
- 43.8. pg_authid
- 43.9. pgauthmembers
- 43.10. pg_autovacuum
- 43.11. pg_cast
- 43.12. pg_class
- 43.13. pg_constraint
- 43.14. pg_conversion
- 43.15. pg_database
- 43.16. pg_depend
- 43.17. pg_description
- 43.18. pg_index
- 43.19. pg_inherits
- 43.20. pg_language
- 43.21. pg_largeobject
- 43.22. pg_listener
- 43.23. pg_namespace
- 43.24. pg_opclass
- 43.25. pg_operator
- 43.26. pg_pltemplate
- 43.27. pg_proc
- 43.28. pg_rewrite
- 43.29. pg_shdepend
- 43.30. pg_shdescription
- 43.31. pg_statistic
- 43.32. pg_tablespace
- 43.33. pg_trigger
- 43.34. pg_type
- 43.35. 系统视图
- 43.36. pg_cursors
- 43.37. pg_group
- 43.38. pg_indexes
- 43.39. pg_locks
- 43.40. pgpreparedstatements
- 43.41. pgpreparedxacts
- 43.42. pg_roles
- 43.43. pg_rules
- 43.44. pg_settings
- 43.45. pg_shadow
- 43.46. pg_stats
- 43.47. pg_tables
- 43.48. pgtimezoneabbrevs
- 43.49. pgtimezonenames
- 43.50. pg_user
- 43.51. pg_views
- 章44. 前/后端协议
- 章45. PostgreSQL 编码约定
- 章46. 本地语言支持
- 章47. 书写一个过程语言处理器
- 章48. 基因查询优化器
- 章49. 索引访问方法接口定义
- 章50. GiST 索引
- 章51. GIN 索引
- 章52. 数据库物理存储
- 章53. BKI 后端接口
- 章54. 规划器如何使用统计信息
VIII. 附录
52.3. 数据库分页文件
本章提供一个表和索引所使用的页面格式的概述。[1] 序列和 TOAST 的格式与普通表一样。
在下面解释中,假定一个字节包含 8 bit;项指的是存储在一个页面里的独立数据值。在一个表里,一个项是一个行;在一个索引里,一个项是一条索引记录。
每个表和索引都以固定尺寸(通常是 8K ,但也可以在编译时选择其它尺寸)的页面数组存储。在表里,所有页面逻辑上都相同,所以一个特定的项(行)可以存储在任何页面里。在索引里,第一个页面通常保留为元页面,保存着控制信息,并且依索引访问方法的不同,在索引里可能有不同类型的页面。
表52-2显示一个页面的总体布局。每个页面有五个部分。
表52-2. 总体页面布局
项 | 描述 |
---|---|
PageHeaderData | 页头数据。20 字节长。包含关于页面的一般信息,包括自由空间指针。 |
ItemPointerData | 项指针数据。(offset,length)对的数组,指向实际项。每个项 4 字节。 |
Free space | 未分配的空间。新项指针从这个区域的开头开始分配,新项从结尾开始分配。 |
Items | 实际的项自身。 |
Special space | 特殊空间。索引访问模式特定的数据。不同的索引方法存放不同的数据。在普通表中为空。 |
每个页面的头 20 个字节组成页头(PageHeaderData)。它的格式在表52-3里详细介绍。头两个字节跟踪与此页面相关的最近的 WAL 项。然后跟着三个 2 字节的整数字段(pd_lower
, pd_upper
, pd_special
)。这些字段分别包含页面开始位置与未分配空间开头的字节偏移,与未分配空间结尾的字节偏移,以及与特殊空间开头的字节偏移。页面头的最后 2 字节(pd_pagesize_version
)存储页面尺寸和版本指示器。PostgreSQL 8.1/8.2 版本号是 3 ;PostgreSQL 8.0 为 2 ;PostgreSQL 7.3/7.4 为 1 ;之前的为 0 。基本页面布局和头格式在这些版本里都没有改变,但是堆的行头部布局有所变化。页面大小主要用于交叉检查;目前在一次安装里,还没有支持多于一种页面大小的东西。
表52-3. PageHeaderData 布局
字段 | 类型 | 长度 | 描述 |
---|---|---|---|
pd_lsn | XLogRecPtr | 8 字节 | LSN: 最后修改这个页面的 xlog 记录最后一个字节后面第一个字节 |
pd_tli | TimeLineID | 4 字节 | 最后修改的 TLI |
pd_lower | LocationIndex | 2 字节 | 到自由空间开头的偏移量 |
pd_upper | LocationIndex | 2 字节 | 到自由空间结尾的偏移量 |
pd_special | LocationIndex | 2 字节 | 到特殊空间开头的偏移量 |
pd_pagesize_version | uint16 | 2 字节 | 页面大小和布局版本号信息 |
所有细节都可以在 src/include/storage/bufpage.h
里找到。
在页头后面是项标识符(ItemIdData
),每个需要四个字节。一个项标识符包含一个到项开头的字节偏移量,它自己以字节计的长度,以及一套属性位,这些属性位影响它的解释。新的项标识符根据需要从未分配空间的开头分配。项标识符的数目可以通过查看 pd_lower
来判断,在分配新标识符的时候会递增。因为一个项标识符在其释放前绝对不会移动,所以它的索引可以用于长时间地引用一个项,即使该项本身因为压缩自由空间在页面内部进行了移动也如此。实际上,PostgreSQL 创建的每个指向项的指针(ItemPointer
,也叫做 CTID
)都由一个页号和一个项标识符的索引组成。
项本身存储在从未分配空间末尾开始从后向前分配的空间里。它们的实际结构因表包含的内容不同而不同。表和序列都使用一种叫做 HeapTupleHeaderData
的结构,在下面描述。
最后一段是"特殊段",它可以包含任何访问方法想存放的东西。比如,b-tree 索引存储指向页面的左右同宗的链接,以及其它一些和索引结构相关的数据。普通表并不使用这个段(通过设置 pd_special
等于页面大小来表示)。
所有表行都用同样方法构造。它们有一个定长的头(在大多数机器上占据 27 个字节),后面跟着一个可选的 null 位图,一个可选的对象 ID 字段,以及用户数据。头在表52-4里详细描述。实际用户数据(行的字段)从 t_hoff
标识的偏移量开始,它必须是该平台的 MAXALIGN 距离的倍数。null 位图只有在 t_infomask
里面的 HEAP_HASNULL 位设置了的时候才出现。如果它出现了,那么它紧跟在定长头后面,占据足够容纳每个数据字段对应一个位的字节数(也就是说,总共 t_natts
位)。在这个位列里面,为 1 的位表示非空,而为 0 的位表示空。如果没有出现这个位图,那么所有数据字段都假设为非空的。对象 ID 只有在设置了 t_infomask
里面的 HEAP_HASOID 位的时候才出现。如果出现,它正好出现在 t_hoff
范围之前。如果需要补齐 t_hoff
,使之成为 MAXALIGN 的倍数,那么这些填充将出现在 null 位图和对象 ID 之间。这样也保证了对象 ID 得到恰当的对齐。
表52-4. HeapTupleHeaderData 布局
字段 | 类型 | 长度 | 描述 |
---|---|---|---|
t_xmin | TransactionId | 4 字节 | 插入 XID 戳记 |
t_cmin | CommandId | 4 字节 | 插入 CID 戳记 |
t_xmax | TransactionId | 4 字节 | 删除 XID 戳记 |
t_cmax | CommandId | 4 字节 | 删除 CID 戳记(与 t_xvac 重叠) |
t_xvac | TransactionId | 4 字节 | 用于移动行版本操作的 VACUUM 的 XID |
t_ctid | ItemPointerData | 6 字节 | 这个或者新行的当前 TID |
t_natts | int16 | 2 字节 | 字段数目 |
t_infomask | uint16 | 2 字节 | 各种标志位 |
t_hoff | uint8 | 1 字节 | 到用户数据的偏移量 |
所有细节都可以在 src/include/access/htup.h
中找到。
对具体数据的解释只能在从其它表中获取信息的情况下进行,这些信息大多数在 pg_attribute
里。标识字段位置的关键数值是 attlen
和 attalign
。没有办法直接获取某个字段,除非它们是定宽并且没有 NULL 的。所有这些复杂的操作都封装在函数 heap_getattr, fastgetattr, heap_getsysattr 里。
要读取数据的话,你需要轮流检查每个字段。首先根据 null 位图检查该字段是否为 NULL 。如果是,那么跳到下一个字段。然后保证你的对齐是正确的。如果字段是一个定宽字段,那么所有字节都简单地放在那里。如果它是一个变长字段(attlen = -1),那么它就会更加复杂一些。所有变长数据类型都使用一个通用的头结构 varattrib
,它包含所存储的数据的全长以及一些标志位。根据标志的不同,数据可能是内联的或者是在其它表中(TOAST),还可能是压缩的(参阅节52.2)。
注意
[1] | 实际上,索引访问模式并不需要使用这些页面格式。目前,所有索引方法的确都使用这个基本格式,但保留在索引元数据页里的数据通常并不准确地遵循项布局规则。 |
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论