I. 教程
II. SQL 语言
III. 服务器管理
- 章14. 安装指导
- 章15. 在 Windows 上安装客户端
- 章16. 操作系统环境
- 章17. 服务器配置
- 章18. 数据库角色和权限
- 章19. 管理数据库
- 章21. 区域
- 章20. 用户认证
- 章22. 日常数据库维护工作
- 章23. 备份与恢复
- 章24. 高可用性与负载均衡
- 章25. 监控数据库的活动
- 章26. 监控磁盘使用情况
- 章27. 可靠性和预写式日志
- 章28. 回归测试
IV. 客户端接口
- Chapter 28. libpq - C 库
- 章29.
- Chapter 30. ecpg - 在 C 里嵌入 SQL
- Chapter 31. 信息模式
- 31.2. 数据类型
- 31.3. informationschemacatalog_name
- 31.4. applicable_roles
- 31.5. check_constraints
- 31.6. columndomainusage
- 31.7. column_privileges
- 31.8. columnudtusage
- 31.9. columns
- 31.10. constraintcolumnusage
- 31.11. constrainttableusage
- 31.12. datatypeprivileges
- 31.13. domain_constraints
- 31.14. domainudtusage
- 31.15. domains
- 31.16. element_types
- 31.17. enabled_roles
- 31.18. keycolumnusage
- 31.20. referential_constraints
- 31.21. rolecolumngrants
- 31.22. roleroutinegrants
- 31.23. roletablegrants
- 31.24. roleusagegrants
- 31.25. routine_privileges
- 31.26. routines
- 31.27. schemata
- 31.28. sql_features
- 31.29. sqlimplementationinfo
- 31.30. sql_languages
- 31.31. sql_packages
- 31.32. sql_sizing
- 31.33. sqlsizingprofiles
- 31.34. table_constraints
- 31.35. table_privileges
- 31.36. tables
- 31.37. triggers
- 31.38. usage_privileges
- 31.39. viewcolumnusage
- 31.40. viewtableusage
- 31.41. views
V. 服务器端编程
- 章33. 扩展 SQL
- 章34. 触发器
- 章35. 规则系统
- 章36. 过程语言
- 章37. PL/pgSQL - SQL 过程语言
- 章38. PL/Tcl - Tcl 过程语言
- 章39. PL/Perl - Perl 过程语言
- 章40. PL/Python - Python 过程语言
- 章41. 服务器编程接口
VI. 参考手册
- I. SQL 命令
- ABORT
- ALTER AGGREGATE
- ALTER CONVERSION
- ALTER DATABASE
- ALTER DOMAIN
- ALTER FUNCTION
- ALTER GROUP
- ALTER INDEX
- ALTER LANGUAGE
- ALTER OPERATOR
- ALTER OPERATOR CLASS
- ALTER ROLE
- ALTER SCHEMA
- ALTER SEQUENCE
- ALTER TABLE
- ALTER TABLESPACE
- ALTER TRIGGER
- ALTER TYPE
- ALTER USER
- ANALYZE
- BEGIN
- CHECKPOINT
- CLOSE
- CLUSTER
- COMMENT
- COMMIT PREPARED
- COMMIT
- COPY
- CREATE AGGREGATE
- CREATE CAST
- CREATE CONSTRAINT TRIGGER
- CREATE CONVERSION
- CREATE DATABASE
- CREATE DOMAIN
- CREATE FUNCTION
- CREATE GROUP
- CREATE INDEX
- CREATE LANGUAGE
- CREATE OPERATOR CLASS
- CREATE OPERATOR
- CREATE ROLE
- CREATE RULE
- CREATE SCHEMA
- CREATE SEQUENCE
- CREATE TABLE
- CREATE TABLE AS
- CREATE TABLESPACE
- CREATE TRIGGER
- CREATE TYPE
- CREATE USER
- CREATE VIEW
- DEALLOCATE
- DECLARE
- DELETE
- DROP OWNED
- DROP AGGREGATE
- DROP CAST
- DROP CONVERSION
- DROP DATABASE
- DROP DOMAIN
- DROP FUNCTION
- DROP GROUP
- DROP INDEX
- DROP LANGUAGE
- DROP OPERATOR CLASS
- DROP OPERATOR
- DROP ROLE
- DROP RULE
- DROP SCHEMA
- DROP SEQUENCE
- DROP TABLE
- DROP TABLESPACE
- DROP TRIGGER
- DROP TYPE
- DROP USER
- DROP VIEW
- END
- EXECUTE
- EXPLAIN
- FETCH
- GRANT
- INSERT
- LISTEN
- LOAD
- LOCK
- MOVE
- NOTIFY
- PREPARE TRANSACTION
- PREPARE
- REASSIGN OWNED
- REINDEX
- RELEASE SAVEPOINT
- RESET
- REVOKE
- ROLLBACK PREPARED
- ROLLBACK TO SAVEPOINT
- ROLLBACK
- SAVEPOINT
- SELECT
- SELECT INTO
- SET
- SET CONSTRAINTS
- SET ROLE
- SET SESSION AUTHORIZATION
- SET TRANSACTION
- SHOW
- START TRANSACTION
- TRUNCATE
- UNLISTEN
- UPDATE
- VACUUM
- II. PostgreSQL 客户端应用程序
- III. PostgreSQL 服务器应用程序
VII. 内部
- 章42. PostgreSQL 内部概貌
- 章43. 系统表
- 43.1. 概述
- 43.2. pg_aggregate
- 43.3. pg_am
- 43.4. pg_amop
- 43.5. pg_amproc
- 43.6. pg_attrdef
- 43.7. pg_attribute
- 43.8. pg_authid
- 43.9. pgauthmembers
- 43.10. pg_autovacuum
- 43.11. pg_cast
- 43.12. pg_class
- 43.13. pg_constraint
- 43.14. pg_conversion
- 43.15. pg_database
- 43.16. pg_depend
- 43.17. pg_description
- 43.18. pg_index
- 43.19. pg_inherits
- 43.20. pg_language
- 43.21. pg_largeobject
- 43.22. pg_listener
- 43.23. pg_namespace
- 43.24. pg_opclass
- 43.25. pg_operator
- 43.26. pg_pltemplate
- 43.27. pg_proc
- 43.28. pg_rewrite
- 43.29. pg_shdepend
- 43.30. pg_shdescription
- 43.31. pg_statistic
- 43.32. pg_tablespace
- 43.33. pg_trigger
- 43.34. pg_type
- 43.35. 系统视图
- 43.36. pg_cursors
- 43.37. pg_group
- 43.38. pg_indexes
- 43.39. pg_locks
- 43.40. pgpreparedstatements
- 43.41. pgpreparedxacts
- 43.42. pg_roles
- 43.43. pg_rules
- 43.44. pg_settings
- 43.45. pg_shadow
- 43.46. pg_stats
- 43.47. pg_tables
- 43.48. pgtimezoneabbrevs
- 43.49. pgtimezonenames
- 43.50. pg_user
- 43.51. pg_views
- 章44. 前/后端协议
- 章45. PostgreSQL 编码约定
- 章46. 本地语言支持
- 章47. 书写一个过程语言处理器
- 章48. 基因查询优化器
- 章49. 索引访问方法接口定义
- 章50. GiST 索引
- 章51. GIN 索引
- 章52. 数据库物理存储
- 章53. BKI 后端接口
- 章54. 规划器如何使用统计信息
VIII. 附录
11.7. 部分索引
部分索引是建立在一个表的子集上的索引;该子集是由一个条件表达式定义的(叫做部分索引的谓词)。该索引只包含表中那些满足这个谓词的行。部分索引是一个特殊的特性,但是在某些场合很有用。
部分索引的主要动机是为了避免对普通数值(大量重复的数值)建立索引。因为在普通数值上的查询就算使用索引也没什么好处,那么还不如从索引中剔除这些大量重复的行。这样可以减小索引尺寸,提高那些真正使用索引的查询的速度。同时它也能提高更新操作的速度,因为不是所有情况都需要更新索引。例11-1显示了一个潜在的这方面应用的例子。
例11-1. 设置一个部分索引以排除普通数值
假设你在数据库中存储 web 服务器的访问日志。大多数访问是从你的组织内部的 IP 地址范围发起的,但也有一小部分来自其它地方(比如那些通过拨号进行连接的雇员)。如果你主要搜索来自外部访问的 IP ,那么你就不需要对组织子网的 IP 范围进行索引。
假设表像下面这样:
CREATE TABLE access_log ( url varchar, client_ip inet, ... );
要创建符合例子的索引,使用像下面这样的命令:
CREATE INDEX access_log_client_ip_ix ON access_log (client_ip) WHERE NOT (client_ip > inet '192.168.100.0' AND client_ip < inet '192.168.100.255');
一个可以使用这个索引的典型的查询像这样:
SELECT * FROM access_log WHERE url = '/index.html' AND client_ip = inet '212.78.10.32';
一个不能使用这个索引的查询是:
SELECT * FROM access_log WHERE client_ip = inet '192.168.100.23';
我们通过观察可以看出,这种类型的部分索引要求普通数值是可以预计的。如果数值的分布是固有的(来自应用自身的性质)并且是静态的(不随时间而改变),那做到这一点(跟踪普通数值)并不困难,但是如果普通数值只是因为一致的数据装载,那么它可能就要花很多维护性工作,不时地改变索引定义。
另外一个用途在例11-2里显示,它把不感兴趣的数值排除在索引之外。这个结果有与上面列出的同样的优点,但是它完全拒绝了通过索引访问"不感兴趣"的数值,即使索引扫描可能对那些数据也有利。显然,为这种情况设置部分索引需要非常仔细并且需要大量试验。
例11-2. 设置一个部分索引以排除不感兴趣的数值
如果你有一个表,包含已付款和未付款的定单,而未付款的定单只占总表的一小部分并且是经常使用的部分,那么你可以通过只在未付款定单上创建一个索引来改善性能。创建索引的命令看起来会像这样:
CREATE INDEX orders_unbilled_index ON orders (order_nr) WHERE billed is not true;
可能用到这个索引的查询看起来像
SELECT * FROM orders WHERE billed is not true AND order_nr < 10000;
不过,该索引也可以用于那些完全不涉及 order_nr
查询,比如
SELECT * FROM orders WHERE billed is not true AND amount > 5000.00;
这个查询不像在 amount
字段上的部分索引那么有效,因为系统必须扫描整个索引。但是,如果未付款的定单相对较少,那么用这个部分索引找出未付款的定单将会更快些。
请注意下面这个查询无法使用这个索引:
SELECT * FROM orders WHERE order_nr = 3501;
定单 3501 可能是已付款也可能是未付款。
例11-2还说明了建了索引的字段和谓词中的字段不必相配。PostgreSQL 支持带任意谓词的部分索引,只要只涉及被索引表的字段就行。不过,我们要记住的是谓词必须和那些希望从该索引中获益的查询条件相匹配。准确说,只有在系统能够识别出该查询的 WHERE
条件在数学上蕴涵了该索引的谓词时,这个部分索引才能用于该查询。PostgreSQL 还没有智能到可以完全识别那些形式不同但数学上相等的谓词。做到这样不仅非常困难,而且在实际使用中也可能非常慢。系统可以识别简单的不相等蕴涵,比如"x < 1"蕴涵"x < 2";否则,谓词条件必须准确匹配查询的 WHERE
条件,不然系统将无法识别该索引是可用的。匹配发生在查询规划期间,而不是运行期间。因此,参数化的查询子句必定不会使用部分索引。例如,一个预先写好的、带有参数的查询可能指定了"x < ?",它不可能对所有可能的参数值都蕴涵"x < 2"。
部分索引的第三种用途是禁止在查询中使用索引。如例11-3所示,这里的概念是在表的子集里创建唯一索引。这样就强制在满足谓词的行中保持唯一性,而并不约束那些不需要唯一的行。
例11-3. 设置一个部分唯一索引
假设我们有一个记录测试输出的表。我们希望确保在每个目标和课题的组合中只有一个"成功"记录,但是可以有任意数量的"不成功"记录。下面是实现方法:
CREATE TABLE tests ( subject text, target text, success boolean, ... ); CREATE UNIQUE INDEX tests_success_constraint ON tests (subject, target) WHERE success;
如果只有少数成功测试而有很多不成功测试,那么这是一种非常有效的实现方法。
最后,部分索引也可以用于取代系统选择的查询规划。可能会出现这样的情况:如果数据集的分布是比较特定的形状,那么会导致系统在不该使用索引的时候使用它。在这种情况下,我们可以把索引设置为在违反规律的查询中不可用。通常 PostgreSQL 对索引的使用会做出合理的选择(比如,它在检索普通数值的时候避免使用它,因此前面的例子实际上只是节约了索引的尺寸,它并不要求避免索引的使用),但是如果出现了错误的规划选择那么请提交一个臭虫报告。
请记住一件事:设置一个部分索引表示你至少和查询规划器知道的一样多,特别是你知道什么场合下索引是有效的。要形成这些知识要求你经验丰富并且理解 PostgreSQL 的索引是如何运作的。在大多数情况下,部分索引对普通索引的优势并不太明显。
更多有关部分索引的信息可以在 The case for partial indexes, Partial indexing in POSTGRES: research project, Generalized Partial Indexes 获得。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论