I. 教程
II. SQL 语言
III. 服务器管理
- 章14. 安装指导
- 章15. 在 Windows 上安装客户端
- 章16. 操作系统环境
- 章17. 服务器配置
- 章18. 数据库角色和权限
- 章19. 管理数据库
- 章21. 区域
- 章20. 用户认证
- 章22. 日常数据库维护工作
- 章23. 备份与恢复
- 章24. 高可用性与负载均衡
- 章25. 监控数据库的活动
- 章26. 监控磁盘使用情况
- 章27. 可靠性和预写式日志
- 章28. 回归测试
IV. 客户端接口
- Chapter 28. libpq - C 库
- 章29.
- Chapter 30. ecpg - 在 C 里嵌入 SQL
- Chapter 31. 信息模式
- 31.2. 数据类型
- 31.3. informationschemacatalog_name
- 31.4. applicable_roles
- 31.5. check_constraints
- 31.6. columndomainusage
- 31.7. column_privileges
- 31.8. columnudtusage
- 31.9. columns
- 31.10. constraintcolumnusage
- 31.11. constrainttableusage
- 31.12. datatypeprivileges
- 31.13. domain_constraints
- 31.14. domainudtusage
- 31.15. domains
- 31.16. element_types
- 31.17. enabled_roles
- 31.18. keycolumnusage
- 31.20. referential_constraints
- 31.21. rolecolumngrants
- 31.22. roleroutinegrants
- 31.23. roletablegrants
- 31.24. roleusagegrants
- 31.25. routine_privileges
- 31.26. routines
- 31.27. schemata
- 31.28. sql_features
- 31.29. sqlimplementationinfo
- 31.30. sql_languages
- 31.31. sql_packages
- 31.32. sql_sizing
- 31.33. sqlsizingprofiles
- 31.34. table_constraints
- 31.35. table_privileges
- 31.36. tables
- 31.37. triggers
- 31.38. usage_privileges
- 31.39. viewcolumnusage
- 31.40. viewtableusage
- 31.41. views
V. 服务器端编程
- 章33. 扩展 SQL
- 章34. 触发器
- 章35. 规则系统
- 章36. 过程语言
- 章37. PL/pgSQL - SQL 过程语言
- 章38. PL/Tcl - Tcl 过程语言
- 章39. PL/Perl - Perl 过程语言
- 章40. PL/Python - Python 过程语言
- 章41. 服务器编程接口
VI. 参考手册
- I. SQL 命令
- ABORT
- ALTER AGGREGATE
- ALTER CONVERSION
- ALTER DATABASE
- ALTER DOMAIN
- ALTER FUNCTION
- ALTER GROUP
- ALTER INDEX
- ALTER LANGUAGE
- ALTER OPERATOR
- ALTER OPERATOR CLASS
- ALTER ROLE
- ALTER SCHEMA
- ALTER SEQUENCE
- ALTER TABLE
- ALTER TABLESPACE
- ALTER TRIGGER
- ALTER TYPE
- ALTER USER
- ANALYZE
- BEGIN
- CHECKPOINT
- CLOSE
- CLUSTER
- COMMENT
- COMMIT PREPARED
- COMMIT
- COPY
- CREATE AGGREGATE
- CREATE CAST
- CREATE CONSTRAINT TRIGGER
- CREATE CONVERSION
- CREATE DATABASE
- CREATE DOMAIN
- CREATE FUNCTION
- CREATE GROUP
- CREATE INDEX
- CREATE LANGUAGE
- CREATE OPERATOR CLASS
- CREATE OPERATOR
- CREATE ROLE
- CREATE RULE
- CREATE SCHEMA
- CREATE SEQUENCE
- CREATE TABLE
- CREATE TABLE AS
- CREATE TABLESPACE
- CREATE TRIGGER
- CREATE TYPE
- CREATE USER
- CREATE VIEW
- DEALLOCATE
- DECLARE
- DELETE
- DROP OWNED
- DROP AGGREGATE
- DROP CAST
- DROP CONVERSION
- DROP DATABASE
- DROP DOMAIN
- DROP FUNCTION
- DROP GROUP
- DROP INDEX
- DROP LANGUAGE
- DROP OPERATOR CLASS
- DROP OPERATOR
- DROP ROLE
- DROP RULE
- DROP SCHEMA
- DROP SEQUENCE
- DROP TABLE
- DROP TABLESPACE
- DROP TRIGGER
- DROP TYPE
- DROP USER
- DROP VIEW
- END
- EXECUTE
- EXPLAIN
- FETCH
- GRANT
- INSERT
- LISTEN
- LOAD
- LOCK
- MOVE
- NOTIFY
- PREPARE TRANSACTION
- PREPARE
- REASSIGN OWNED
- REINDEX
- RELEASE SAVEPOINT
- RESET
- REVOKE
- ROLLBACK PREPARED
- ROLLBACK TO SAVEPOINT
- ROLLBACK
- SAVEPOINT
- SELECT
- SELECT INTO
- SET
- SET CONSTRAINTS
- SET ROLE
- SET SESSION AUTHORIZATION
- SET TRANSACTION
- SHOW
- START TRANSACTION
- TRUNCATE
- UNLISTEN
- UPDATE
- VACUUM
- II. PostgreSQL 客户端应用程序
- III. PostgreSQL 服务器应用程序
VII. 内部
- 章42. PostgreSQL 内部概貌
- 章43. 系统表
- 43.1. 概述
- 43.2. pg_aggregate
- 43.3. pg_am
- 43.4. pg_amop
- 43.5. pg_amproc
- 43.6. pg_attrdef
- 43.7. pg_attribute
- 43.8. pg_authid
- 43.9. pgauthmembers
- 43.10. pg_autovacuum
- 43.11. pg_cast
- 43.12. pg_class
- 43.13. pg_constraint
- 43.14. pg_conversion
- 43.15. pg_database
- 43.16. pg_depend
- 43.17. pg_description
- 43.18. pg_index
- 43.19. pg_inherits
- 43.20. pg_language
- 43.21. pg_largeobject
- 43.22. pg_listener
- 43.23. pg_namespace
- 43.24. pg_opclass
- 43.25. pg_operator
- 43.26. pg_pltemplate
- 43.27. pg_proc
- 43.28. pg_rewrite
- 43.29. pg_shdepend
- 43.30. pg_shdescription
- 43.31. pg_statistic
- 43.32. pg_tablespace
- 43.33. pg_trigger
- 43.34. pg_type
- 43.35. 系统视图
- 43.36. pg_cursors
- 43.37. pg_group
- 43.38. pg_indexes
- 43.39. pg_locks
- 43.40. pgpreparedstatements
- 43.41. pgpreparedxacts
- 43.42. pg_roles
- 43.43. pg_rules
- 43.44. pg_settings
- 43.45. pg_shadow
- 43.46. pg_stats
- 43.47. pg_tables
- 43.48. pgtimezoneabbrevs
- 43.49. pgtimezonenames
- 43.50. pg_user
- 43.51. pg_views
- 章44. 前/后端协议
- 章45. PostgreSQL 编码约定
- 章46. 本地语言支持
- 章47. 书写一个过程语言处理器
- 章48. 基因查询优化器
- 章49. 索引访问方法接口定义
- 章50. GiST 索引
- 章51. GIN 索引
- 章52. 数据库物理存储
- 章53. BKI 后端接口
- 章54. 规划器如何使用统计信息
VIII. 附录
49.6. 索引开销估计函数
系统给 amcostestimate 函数一个 WHERE 子句的列表,这个 WHERE 子句列表是系统认为可以被索引使用的东西。它必须返回访问该索引的开销估计值以及 WHERE 子句的选择性(也就是说,在索引扫描期间检索的将被返回的数据行在父表中所占据的比例)。对于简单的场合,几乎开销估计器的所有工作都可以通过调用优化器里面的标准过程完成;有 amcostestimate 这个函数的目的是允许索引访问方法提供和索引类型相关的知识,这样也许可以改进标准的开销估计。
每个 amcostestimate 函数都有下面这样的签名:
void amcostestimate (PlannerInfo *root, IndexOptInfo *index, List *indexQuals, RelOptInfo *outer_rel, Cost *indexStartupCost, Cost *indexTotalCost, Selectivity *indexSelectivity, double *indexCorrelation);
头四个参数是输入:
- root
规划器的有关正在被处理的查询的信息。
- index
在考虑使用的索引。
- indexQuals
索引条件子句的列表(隐含是 AND 的);如果是 NIL 列表(空列表)就表示没有可用的条件。请注意这个列表包含表达式树,而不是 ScanKey(扫描键字)。
- outer_rel
如果该索引可能要用于连接内部扫描,那么这个将是规划器关于连接的外侧信息,否则为 NULL 。当不为 NULL 时,一些 qual 字句将会连接使用带有这个 rel 的字句而不是简单的约束字句。同样,开销评估应当考虑到索引扫描将会为 rel 的每一行执行一次。
后面四个参数是传递引用的输出:
- *indexStartupCost
设置为索引启动处理的开销
- *indexTotalCost
设置为索引处理的总开销
- *indexSelectivity
设置为索引的选择型
- *indexCorrelation
设置为索引扫描顺序和下层的表的顺序之间的相关有效性
请注意开销估计函数必须用 C 写,而不能用 SQL 或者任何可用的存储过程语言,因为它们必须访问规划器/优化器的内部数据结构。
索引访问开销应该以 src/backend/optimizer/path/costsize.c
使用的单位进行计算:一个顺序磁盘块抓取开销是 1.0 ,一个非顺序抓取开销是 seq_page_cost
,而处理一个索引行的开销通常应该是 random_page_cost
,而处理一个索引行的开销通常应该是 cpu_index_tuple_cost
。另外,在任何索引处理期间调用的比较操作符,都应该增加一个数量为 cpu_operator_cost
倍数的开销(特别是计算索引条件 indexQuals t自己的时候)。
访问开销应该包括所有与扫描索引本身相关的磁盘和 CPU 开销,但是不包括检索或者处理索引标识出来的父表的行的开销。
"启动开销"是总扫描开销中的这样一部分:在开始抓取第一行之前,必须花掉的开销。对于大多数索引,这个可以是零,但是那些启动开销很大的索引类型可能不能把它设置为零。
indexSelectivity 应该设置成在索引扫描期间,父表中的行被选出出来的部分的百分比。在索引比较松散的情况下,这个值通常比实际通过给出的查询条件之行所占的百分比要高。
indexCorrelation 应该设置成索引顺序和表顺序之间的相关性(范围在 -1.0 到 1.0 之间)。这个数值用于调整从父表中抓取行的开销估计。
在连接情况下,返回的数值应当在每一次索引扫描之间平均。
开销估计
一个典型的开销估计器会像下面这样进行处理:
基于给出的查询条件,估计并返回父表中将被访问的行的百分比。如果缺乏索引类型相关得知识,那么使用标准的优化器函数
clauselist_selectivity()
:*indexSelectivity = clauselist_selectivity(root, indexQuals, index->rel->relid, JOIN_INNER);
估计在扫描过程中将被访问的索引行数。对于许多索引类型,这个等于 indexSelectivity 乘以索引中的行数,但是可能更多。请注意,页面中的索引尺寸和行数可以从 IndexOptInfo 结构中获得。
估计在扫描中将检索的索引页面数量。这个可能就是 indexSelectivity 乘以索引的总页面数。
计算索引访问开销。一个通用的估计器可以这么干:
/* * Our generic assumption is that the index pages will be read * sequentially, so they cost seq_page_cost each, not random_page_cost. * Also, we charge for evaluation of the indexquals at each index row. * All the costs are assumed to be paid incrementally during the scan. */ cost_qual_eval(&index_qual_cost, indexQuals); *indexStartupCost = index_qual_cost.startup; *indexTotalCost = seq_page_cost * numIndexPages + (cpu_index_tuple_cost + index_qual_cost.per_tuple) * numIndexTuples;
不过,上面没有考虑在连接情况下的多次索引扫描中分期(amortization)开销。
估计索引的相关性。对于简单的在单个字段上的有序索引,这个值可以从 pg_statistic 中检索。如果相关性是未知,那么保守的估计是零(没有相关性)。
开销估计器函数的例子可以在 src/backend/utils/adt/selfuncs.c
里面找到。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论