重载 new 运算符以将对象存储在 mmap 文件中

发布于 2024-10-11 14:07:42 字数 520 浏览 5 评论 0原文

我有一个 Linux C++ 程序，需要相当大的内存。大部分内存仅被少数类消耗，并且访问频率相当低。我想将这些类从主内存移动到基于磁盘的存储，同时尽可能少地更改现有代码。

这个想法是重写这些对象的 new 运算符，并将它们分配到 mmap() 的内存区域中。这样我的代码修改就非常有限，程序的其余部分可以愉快地访问这些对象，而无需知道任何更改，并且内核将确保我需要的对象位于内存中，而其他对象位于磁盘上。我知道这与交换的工作方式非常相似，但交换分区通常对于我的程序需要来说太小。

我有一些问题：

这是一个非常糟糕的主意吗？您知道有什么更好的方法可以实现同样的目标吗？
我是否需要预先分配最大文件大小，是否需要在磁盘上分配所有这些空间？如果是这样，映射到稀疏文件会有帮助吗？
我不想编写自己的堆分配器。我可以使用现有的吗？
当我的程序完成时，mmap 文件将被删除。这意味着我不希望将任何页面写入磁盘，除非内核实际上将它们从内存中删除。是否有类似于 mmap 的惰性标志来实现此目的，或者这是自动的？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

小霸王臭丫头 2024-10-18 14:07:42

依次查看每个问题

这是一个非常糟糕的主意吗？您是否知道更好的方法来实现相同的目标？

目前还不清楚您希望通过此实现什么目的。 Linux 已经支持交换空间使用的内存（因此，如果您的数据超过物理内存，一些数据将被交换到磁盘）。您是否遇到地址空间不足或由于过多分页而运行缓慢的问题？使用 mmap 支持的存储也不会产生真正的影响。

我是否需要预先分配最大文件大小，以及我是否需要在磁盘上分配所有这些空间？如果是这样，映射到稀疏文件会有帮助吗？

是的，您需要文件与映射的空间一样大。但是，您可以从一个小文件/mmap 开始，然后根据需要增大文件（以及 mmap 附加页面）。您还可以使用稀疏文件，以便在写入页面之前不会使用磁盘空间。

我不想编写自己的堆分配器。我可以使用现有的吗？

有些堆管理器使用 mmap 支持的存储。我见过 Doug Lea malloc 的版本，以及其他各种这样做的 bibop 分配器。

当我的程序完成时，mmap 文件将被删除。这意味着我不希望将任何页面写入磁盘，除非内核实际上将它们从内存中删除。是否有类似 mmap 的惰性标志来实现此目的，或者这是自动的？

在这种情况下，您可以只使用 MAP_ANON 而根本没有文件。然而，这又回到了第一个问题，因为这本质上是重复系统 malloc （和 new）所做的事情。事实上，在某些操作系统（Solaris？）上，这正是系统 malloc 的作用。我过去看到基于 mmap 的自定义 malloc 的主要原因是为了持久存储（因此文件将在进程退出后保留并在重新启动时重新映射）。

回复收藏 0 原文

独享拥抱 2024-10-18 14:07:42

我可以想到您想要采取的方法的一些问题，所以这还不是答案。

当您“交换”某些东西时，即您面临的问题是它消耗了太多内存来保留对象，所以什么时候删除它们（有效地取消映射）？即做出与操作系统的内存管理器相同的决定？
尽管您可以将类的二进制表示形式存储在 mmaped 块中，但如果该类不是 POD，则“交换”过程将不会执行您所期望的操作（例如，如果存在堆成员）已分配 - 它们会发生什么？）
mmap 的内存仍然会影响您的进程，因此，您的问题不会消失...

我认为您最好的选择是查看您的设计并考虑何时需要这些类以及持续多久。不需要时就建造、使用和丢弃——它们的建造成本高吗？也许它们序列化到一些本地文件并重建会更便宜（当我说序列化时，我的意思不仅仅是内存复制！）

回复收藏 0 原文