当前位置：文江博客话题详情

subtree c++ object-persistence

是否有可能编写一个真正通用的磁盘烘焙 B+Tree 实现？

发布于 2024-10-04 10:34:49 字数 405 浏览 10 评论 0原文

几年前，我用 C++ 编写了一个通用的内存中 B+Tree 实现，我正在考虑将其持久保存在磁盘上（这就是最初设计 B+Tree 的原因）。我的第一个想法是使用 mmap （我在 Linux 下）能够像普通内存一样操作文件，只需重写节点类的 new 运算符，以便它返回映射部分中的指针并创建一个智能指针，它可以将 RAM 地址转换为文件偏移量，以将我的节点与其他节点链接起来。但我希望我的实现是通用的，因此用户可以在 B+ 树中存储 int、std::string 或他想要的任何自定义类。这就是问题发生的地方：对于不包含指针的原始类型或聚合类型来说这一切都很好，但是一旦对象包含对堆分配对象的指针/引用，这种方法就不再有效。

所以我的问题是：有没有一些已知的方法可以克服这个困难？我对这个主题的个人搜索最终没有成功，但也许我错过了一些东西。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

微暖i 2024-10-11 10:34:49

据我所知，有三种（稍微）简单的方法可以解决这个问题。

方法 1：编写一个指向某些预分配内存的 std::streambuf。

这种方法允许您使用operator<<并使用任何已经存在的现有代码来获取您想要的字符串表示形式。

优点：重用大量现有代码。
缺点：无法控制 operator<< 如何吐出内容。
缺点：仅基于文本的表示。

方法 2：编写自己的（多次重载）输出函数。

优点：可以提出二进制表示。
优点：精确控制每种输出格式。
缺点：重写如此多的输出函数...客户端为新类型编写重载是一件痛苦的事情，因为他们不应该编写属于您的库名称空间的函数...除非您求助于 Koenig（依赖参数）查找！

方法 3：编写 btree_traits 模板。

优点：可以提出二进制表示。
优点：精确控制每种输出格式。
优点：对函数的输出和格式有更多控制，可能包含元数据等。
缺点：仍然需要您/您的库的用户编写大量自定义重载。
优点：拥有 btree_traits<> 默认值来使用 operator<< 除非有人覆盖这些特征？

回复收藏 0 原文

把时间冻结 2024-10-11 10:34:49

您无法编写真正通用且透明的版本，因为如果非平凡项中的指针是使用 malloc （或 new 和 new[]）分配的，那么它已经在堆中。

非透明的解决方案可能是序列化类是一种选择，并且这可以相对容易地完成。在存储类之前，您必须调用序列化函数，在拉取它之前，您需要调用反序列化。 Boost 具有良好的序列化功能，您可以将其与 B+Tree 一起使用。

回复收藏 0 原文

朮生 2024-10-11 10:34:49

以通用方式处理指针和引用意味着您需要检查要存储的结构的类型及其字段。 C++ 是一种不以其反射性而闻名的语言。

但即使是一种具有强大反射能力的语言，这个问题的通用解决方案也很困难。您也许能够让它适用于 Python、Ruby 等高级语言中类型的子集。一个相关且更强大的范例是持久编程语言。

您想要的功能通常是通过将写入数据块的责任委托给目标类型本身来实现的。它称为序列化。它只是意味着编写一个带有转储数据的方法和加载数据的方法的接口。任何想要保留在 B 树中的类只需实现此接口即可。

回复收藏 0 原文

~没有更多了~

关于作者

吹梦到西洲

暂无简介

文章

评论

27 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

佚名

文章 0 评论 0

羁客

文章 0 评论 0

天天爱笑的徐老师

文章 0 评论 0

星

文章 0 评论 0

夏日落

文章 0 评论 0

隐诗

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文