如何在不使指向缓冲区的指针无效的情况下增加缓冲区？

发布于 2024-11-04 04:40:16 字数 503 浏览 7 评论 0原文

_{^{术语“池”和“缓冲区”在这里可以互换使用。}}
假设我有一个想要在程序开始时分配的池，以免总是调用new。
现在，我不想人为地限制自己的池大小，但如果我重新分配一个更大的池，所有指向旧池的指针都将失效，这当然不是很酷。

我想到的一种方法是“分页”，又名

const int NUM_PAGES = 5;
char* pool[NUM_PAGES];

分配一个新页面而不是仅重新分配一个页面。这将使所有指针保持有效，但使分页池的管理变得更加困难。另外，我限制了自己的页面数量，所以最后还是限制了池的大小。

另一种方法是从分配函数返回的指针到指向实际内存空间的指针进行映射。这将使所有旧指针保持有效，但会占用更多内存，并且我需要编写一个智能指针以从执行映射的分配函数返回。

还有哪些其他可能的方法可以实现我想要的目标？在上面的示例实现中我错过了哪些（缺点）优点？

原文

_{^{The terms 'pool' and 'buffer' may be used interchangeably here.}}
Suppose I have a pool I want to allocate at the beginning of the programm, as to not always call new all the time.
Now, I don't want to artificially limit myself on the size of the pool, but if I reallocate a bigger pool, all pointers to the old one will be invalidated, which certainly isn't very cool.

One way I thought of was "paging", aka

const int NUM_PAGES = 5;
char* pool[NUM_PAGES];

And allocate a new page instead of reallocating only one page. This would let all pointers stay valid, but make the management of the paged-pool a bit more difficult. Also, I'm limiting myself on the number of pages, so in the end again on the size of the pool.

Another way was to have a mapping from the pointers my allocation function returns to pointers to the real memory space. This would let all the old pointers stay valid, but would take more memory and I'd need to write a smart pointer to return from my allocation function which does the mapping.

Which other possible ways to achieve what I want are there? What (dis)advantages have I missed in my above example implementations?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

月棠 2024-11-11 04:40:16

你所说的东西让我想起了 std::deque。我不太确定您是否可以按原样使用 std::deque，或者您是否只需要使用其基本设计来实现某种分配器。

回复收藏 0 原文

究竟谁懂我的在乎 2024-11-11 04:40:16

扩展您的分页“池”概念，如果您将页面存储为链接列表会怎样？

要从池中分配新数据，您只需要访问顶部“页面”，该页面将位于列表的头部，因此时间复杂度为 O(1)。如果需要增加池的总大小，请分配一个新页面并将其推入列表的头部，也是 O(1)。

我对池分配器基本上使用相同的想法，但也使用最近释放的项目的“空闲列表”......

编辑：
根据您的评论，如果您还想利用已释放的数据，您还可以存储一个空闲列表，也可能作为链接列表。因此，当您释放数据时，您将指针和大小标记推送到空闲列表上。当您从池中分配数据时，首先检查空闲列表上是否有任何项目可以使用，如果没有则从池中分配。

标准内存管理器通常已经做了类似的事情，因此这种方法并不总是更好。具体来说，我通常只在分配的项大小相同时才使用这种类型的自定义分配器（因此空闲列表的遍历是 O(1)！）。 std::list 的自定义分配器就是一个例子。

希望这有帮助。

回复收藏 0 原文

不可一世的女人 2024-11-11 04:40:16

考虑使用Boost池

回复收藏 0 原文

私藏温柔 2024-11-11 04:40:16

当然，有一个问题是为什么要这么麻烦自己？

您说您希望避免 new 开销，但为什么不选择更好的 new 实现呢？例如，tcmalloc 和 jemalloc 通常是多线程应用程序的非常好的竞争者。

事实上，您尝试创建的内容与编写自定义的 malloc / new 实现非常相似。因此，如果您确实不想使用经过验证的实现，那么您将从那些使用过的人的见解中受益。

我个人的兴趣倾向于 BiBOP 策略（大袋页面）来对抗碎片化。这个想法是每个分配大小都有一个专用池，因此一个简单的空闲列表（与分配交错）就足够了（不需要合并）。通常，只要请求的大小小于页面大小（我见过使用 4KB），并且任何更大的内容都会单独分配（在多个页面中），就会执行此操作。废弃的页面被回收。

我主要感兴趣的是，使用 BiBOP 维护区间树地址范围 -> 很容易。页头，从而从（可能）内部元素（如属性）的地址确定对象的完整大小，这对于垃圾收集很有用（参考以下步骤）。

对于多线程分配，tcmalloc 和 jemalloc 使用两种不同的方法：

jemalloc 使用每线程池：适用于固定数量的线程/线程池，但使创建线程的过程更加昂贵
tcmalloc 使用全局多线程池，采用无锁技术，并尝试对可用池上的线程进行负载平衡以限制争用如果线程使用的池被“锁定”（而不是等待），则让线程寻找新的池，并让每个线程将最后使用的池缓存在线程局部变量中。因此，线程是轻量级的，但如果池的数量相对于活动线程的数量来说太低，则可能会出现一些争用。

回复收藏 0 原文

乖乖公主 2024-11-11 04:40:16

一些想法：

当您有一个 std::vector 时，添加元素并触发调整大小会使该容器中的引用/指针/迭代器无效，但不会使引用/指针无效直接寻址所指向的对象。因此，间接层可能会解决您的问题，具体取决于您真正尝试使用这些引用/指针/迭代器执行的操作。
在具有虚拟内存和大地址空间的系统中，您可以进行大量分配，而无需在写入页面之前实际从物理内存资源中分配页面。因此，在此类系统上，您最初可以为向量设置比以往所需的容量更大的容量，而不会感觉浪费了任何有价值的东西。
其他容器 - std::map<> 和 std::list<> - 添加新元素时不会移动其现有元素，因此迭代器/指针/引用仍然有效。