VertiPaq 是什么及其工作原理

发布于 2024-12-02 13:09:57 字数 152 浏览 15 评论 0原文

我正在学习列存储索引（Denali CTP3 功能）并了解到它使用 VertiPaq 架构进行数据压缩。我很想知道它是什么、它是如何工作的、它的架构。我查了谷歌但没有满意的结果。任何人都可以让我详细了解它是什么、它是如何工作的、其背后的算法/架构等。

以及它如何帮助数据压缩

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

深空失忆 2024-12-09 13:09:57

我就此写了一篇博文，希望能够回答您有关列存储索引的问题：
http://www.jamesserra.com/archive/2011/08/sql-server-%e2%80%9cdenali%e2%80%9d-project-apollo/

请让我知道您是否还有疑问。

回复收藏 0 原文

回梦 2024-12-09 13:09:57

以及它如何帮助数据压缩

压缩部分工作得很好，因为同一列中的数据通常变化不大。例如，想象一下（简化）一个存储来自多 (4) 个选择输入的值的列。即使表中有 800 万条记录，列存储中也只有 4 个唯一值。这使得列值更容易压缩。这反过来又使得索引更容易装入内存，从而查询速度更快。

当数据以列方式存储时，数据通常可以
比以行方式存储时压缩更有效。
通常，列内的冗余多于行内的冗余，
这通常意味着数据可以被压缩到更大程度。
当数据压缩程度更高时，获取数据所需的 IO 更少
进入记忆。此外，大部分数据可以驻留在
给定的内存大小。减少IO可以显着加快查询速度
响应时间。在内存中保留更多工作数据集
将加快访问后续查询的响应时间
相同的数据。

来源：有关列存储技术的更多详细信息