当前位置：文江博客话题详情

如何避免堆碎片？

发布于 2024-07-07 11:27:16 字数 233 浏览 6 评论 0原文

我目前正在进行一个医学图像处理项目，需要大量内存。我可以采取什么措施来避免堆碎片并加快对已加载到内存中的图像数据的访问速度？

该应用程序是用 C++ 编写的，在 Windows XP 上运行。

编辑：应用程序对图像数据进行一些预处理，例如重新格式化、计算查找表、提取感兴趣的子图像...应用程序在处理过程中需要大约 2 GB RAM，其中大约1.5 GB 可用于图像数据。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

悟红尘 2024-07-14 11:27:17

答案是有的，但在不了解问题细节的情况下很难概括。

我假设是 32 位 Windows XP。

尽量避免需要 100MB 的连续内存，如果你运气不好，一些随机的 dll 会通过你的可用地址空间在不方便的地方加载自己，从而迅速减少非常大的连续内存区域。根据您需要的 API，这种情况可能很难预防。令人惊讶的是，除了一些“正常”内存使用之外，仅分配几个 400MB 内存块就会让您无处可分配最终的“小”40MB 块。

另一方面，一次预分配合理大小的块。 10MB 左右的量级是一个很好的折衷块大小。如果您能够设法将数据分区为这种大小的块，您将能够相当有效地填充地址空间。

如果您仍然会耗尽地址空间，则需要能够基于某种缓存算法将块调入和调出。选择正确的块进行分页将在很大程度上取决于您的处理算法，并且需要仔细分析。

选择将内容分页到何处是另一个决定。您可能决定将它们写入临时文件。您还可以研究 Microsoft 的地址窗口扩展 API。无论哪种情况，您都需要在应用程序设计中小心清理所有指向即将被调出的内容的指针，否则将会发生非常糟糕的事情。

祝你好运！

回复收藏 0 原文

最初的梦 2024-07-14 11:27:17

如果您要对大型图像矩阵执行操作，您可能需要考虑一种称为“平铺”的技术。这个想法通常是将图像加载到内存中，以便同一连续的字节块不会包含一行中的像素，而是包含 2D 空间中的一个正方形。其背后的基本原理是，您将在 2D 中而不是在一条扫描线上执行更多彼此更接近的操作。

这不会减少内存使用，但可能会对页面交换和性能产生巨大影响。

回复收藏 0 原文

锦欢 2024-07-14 11:27:17

如果没有关于问题的更多信息（例如语言），您可以做的一件事是通过重用分配来避免分配搅动，而不是分配、操作和释放。诸如 dlmalloc 之类的分配器比 Win32 堆更好地处理碎片。

回复收藏 0 原文

七秒鱼° 2024-07-14 11:27:17

这里您将遇到的是虚拟地址范围限制，对于 32b Windows，该范围最多为您提供 2 GB。您还应该意识到，使用 DirectX 或 OpenGL 等图形 API 会将这 2 GB 的大部分用于帧缓冲区、纹理和类似数据。

对于 32b 应用程序来说 1.5-2 GB 是很难实现的。最优雅的方法是使用 64b 操作系统和 64b 应用程序。即使使用 64b 操作系统和 32b 应用程序，只要您使用 LARGE_ADDRESS_AWARE，这也可能有些可行。

但是，由于您需要存储图像数据，您也可以使用文件映射为内存存储 - 这可以通过这样一种方式来完成：您可以提交和访问内存，但根本不使用任何虚拟地址。

回复收藏 0 原文

可是我不能没有你 2024-07-14 11:27:17

猜测这里您的意思是避免碎片，而不是避免碎片整理。还猜测您正在使用非托管语言（可能是 c 或 C++）。我建议您分配大块内存，然后从分配的内存块中提供堆分配。该内存池由于包含大内存块，因此不易产生碎片。总而言之，您应该实现一个自定义内存分配器。

请参阅此处的一些一般想法。

回复收藏 0 原文

只是一片海 2024-07-14 11:27:17

我猜你正在使用非托管的东西，因为在托管平台中，系统（垃圾收集器）负责处理碎片。

对于 C/C++，您可以使用默认分配器以外的其他分配器。（stackowerflow 上已经有一些关于分配器的线程）。

此外，您还可以创建自己的数据存储。例如，在我当前正在进行的项目中，我们有一个用于位图的自定义存储（池）（我们将它们存储在一大块连续的内存中），因为我们有很多位图，并且我们跟踪堆当碎片太大时，对其进行碎片整理。

回复收藏 0 原文

叶落知秋 2024-07-14 11:27:17

您可能需要实施手动内存管理。图像数据寿命长吗？如果没有，那么您可以使用 apache Web 服务器使用的模式：分配大量内存并将它们包装到内存池中。将这些池作为函数中的最后一个参数传递，以便它们可以使用池来满足分配临时内存的需要。一旦调用链完成，池中的所有内存都应该不再使用，因此您可以清理内存区域并再次使用它。分配速度很快，因为它们只意味着向指针添加一个值。释放速度非常快，因为您将立即释放非常大的内存块。

如果您的应用程序是多线程的，您可能需要将池存储在线程本地存储中，以避免跨线程通信开销。

回复收藏 0 原文

轮廓§ 2024-07-14 11:27:17

如果您可以准确地隔离那些可能分配大块的位置，则可以（在 Windows 上）直接调用 VirtualAlloc 而无需通过内存管理器。这将避免普通内存管理器内的碎片。

这是一个简单的解决方案，不需要您使用自定义内存管理器。

回复收藏 0 原文

美胚控场 2024-07-14 11:27:16

如果您正在进行医学图像处理，则可能会一次分配大块（512x512，每像素图像 2 字节）。如果您在图像缓冲区的分配之间分配较小的对象，则会出现碎片。

对于这个特定的用例来说，编写自定义分配器并不一定很困难。您可以对 Image 对象使用标准 C++ 分配器，但对于像素缓冲区，您可以使用全部在 Image 对象内管理的自定义分配。这是一个快速而肮脏的概述：

使用结构的静态数组，每个结构都有：
- 可以容纳 N 个图像的可靠内存块 - 分块将有助于控制碎片 - 尝试将初始 N 设为 5 左右
- 一个并行的布尔数组，指示相应的图像是否正在使用
要分配，请搜索空缓冲区的数组并设置其标志
- 如果没有找到，则将新结构附加到数组末尾
要取消分配，请在数组中找到相应的缓冲区并清除布尔标志。

这只是一个简单的想法，有很大的变化空间。主要技巧是避免释放和重新分配图像像素缓冲区。