当前位置：文江博客话题详情

有效的索引可以在多大程度上克服非常大的表的性能问题？

发布于 2024-09-27 08:39:31 字数 348 浏览 11 评论 0原文

因此，在我看来，对具有 10k 条记录的表的查询和对具有 1000 万条记录的表的查询几乎同样快，如果它们都获取大致相同数量的记录并充分利用简单索引（自动增量、记录 id 类型索引字段）。

我的问题是，如果索引正确并且数据库的设置方式使得查询始终有效地使用这些索引，这是否会扩展到包含近 40 亿条记录的表？

另外，我知道将新记录插入到一个非常大的索引表中可能会非常慢，因为所有索引都必须重新计算，如果我仅将新记录添加到表的末尾，我可以避免这种减慢吗？不起作用，因为索引是二叉树，并且树的很大一部分仍然需要重新计算？

最后，我四处寻找有关使用非常大的表的常见问题解答/警告，但找不到，所以如果有人知道类似的事情，该链接将不胜感激。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

み零 2024-10-04 08:39:32

根据您的要求，这里有一些关于大型表以及索引对它们的影响的好读物，包括成本/效益：

http://www.dba-oracle.com/t_indexing_power.htm

回复收藏 0 原文

﹂绝世的画 2024-10-04 08:39:32

为非常大的表（与任何与数据库相关的事物一样）建立索引取决于许多因素，包括您的访问模式、读取与写入的比率以及可用 RAM 的大小。

如果您可以将“热”（即频繁访问的索引页）放入内存中，那么访问通常会很快。

用于索引非常大的表的策略是使用分区表和分区索引。但是如果您的查询不加入或过滤分区键，那么与未分区表相比，性能不会有任何改进，即不会消除分区。

SQL Server 数据库分区神话与真相

Oracle 分区表和索引

使索引尽可能缩小非常重要。

Kimberly Tripp 的聚集索引争论仍在继续...( SQL Server）

回复收藏 0 原文

秋叶绚丽 2024-10-04 08:39:32

当表变得非常大时，通过唯一索引查找访问数据的速度会减慢，但不会减慢很多。索引在 Postgres 中存储为 B 树结构（不是每个节点只有两个子节点的二叉树），因此 10k 行表可能有 2 个级别，而 10B 行表可能有 4 个级别（取决于表的宽度）行）。因此，当表格变得大得离谱时，它可能会达到 5 级或更高，但这仅意味着额外读取一页，因此可能不会被注意到。

当您插入新行时，您无法控制它们在表的物理布局中插入的位置，因此我假设您的意思是使用索引的最大值来表示“表的末尾”。我知道 Oracle 在这种情况下对叶块分割有一些优化，但我不知道 Postgres。

回复收藏 0 原文

§普罗旺斯的薰衣草 2024-10-04 08:39:32

如果索引正确，插入性能受到的影响可能比选择性能受到的影响更大。 PostgreSQL 中的索引有大量选项，允许您对表的一部分或表中元组的不可变函数的输出进行索引。此外，假设索引可用，索引的大小对速度的影响将比表的实际扫描慢得多。最大的区别在于搜索树和扫描列表之间。当然，索引使用中仍然存在磁盘 I/O 和内存开销，因此大型索引的性能不如理论上的好。

回复收藏 0 原文

~没有更多了~