大于内存的数据结构及其通常如何处理

发布于 2024-07-17 02:57:06 字数 276 浏览 8 评论 0原文

假设我有一个基于文件的数据结构，例如 B+ 树。我的理解是数据应该存储在磁盘上，但索引通常加载在内存中。如果您有一个很大的文件，甚至其索引都无法放入内存怎么办？通常如何处理？其次，由于索引是一棵树，而不是线性数据集，那么它通常如何在磁盘上布局？

我基本上很好奇它在现实世界的项目（例如 Berkeley DB）中是如何完成的。显然我对大方向感兴趣。我希望得到一个想法，这样当我深入研究数据库书籍的 B 树部分时（或者从多年前的 CS XYZ 中回忆起我的记忆），我就有了一些背景信息

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

丿*梦醉红颜 2024-07-24 02:57:07

B 树适用于基于页面的系统，其中给定的节点适合页面。要在 B 树中查找条目，只需一次加载一页，因此您可以这样做。

即使更新它们也不需要同时在内存中存在大量页面 - 我想最困难的操作是在重新组织节点时进行删除，但如果仔细实现，即使这也可以用相对较少的页面来完成记忆。

回复收藏 0 原文

诗酒趁年少 2024-07-24 02:57:07

您可能想看看 SQLite。代码库比 Berkeley DB 小得多，它是公共领域，它的组织和注释非常清晰，源代码文档非常出色。教会了我很多关于现实世界中 btree 的知识

回复收藏 0 原文

我要还你自由 2024-07-24 02:57:07

要回答你的第一个问题，太大而无法放入内存的数据结构通常被分为“页面”，通常所有页面的大小相同，并且每个页面包含数据结构的一部分，以使用您加载和卸载的数据页。

另一个常见选项（在 RDBMS 中不常用，但在 XML 和媒体文件等中很常见）是流式传输，您可以通过加载下一部分并丢弃上一个部分来按顺序处理数据。

这也回答了你的第二个问题，如果你使用分页，那么文件结构是一系列相同大小的页面，如果你使用流式传输，那么数据应该按照你要使用它的顺序排列（在对于树来说，它可能是 DFS 或 BFS 顺序，具体取决于您的应用程序）。

回复收藏 0 原文

~没有更多了~

关于作者

尛丟丟

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

大于内存的数据结构及其通常如何处理

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

daid

我心依旧

晒暮凉

微信用户

DS

〆凄凉。

友情链接

大于内存的数据结构及其通常如何处理

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

daid

我心依旧

晒暮凉

微信用户

DS

〆凄凉。

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。