当前位置：文江博客话题详情

multithreading stl malloc c++ tbb

英特尔 TBB 的可扩展分配器如何工作？

发布于 2024-07-16 05:24:25 字数 777 浏览 14 评论 0 原文

英特尔线程构建模块中的tbb::scalable_allocator实际上在幕后做什么？

这肯定是有效的。我刚刚使用它通过更改单个 std::vector 来将应用程序的执行时间缩短 25%（并且在 4 核系统上看到 CPU 利用率从 ~200% 增加到 350%）。 T> 到 std::vector >。另一方面，在另一个应用程序中，我看到它使已经很大的内存消耗加倍，并将内容发送到交换城市。

英特尔自己的文档并没有透露太多内容（例如，常见问题解答）。在我自己深入研究它的代码之前，谁能告诉我它使用了什么技巧？

更新：第一次使用 TBB 3.0，并从可扩展_分配器中看到了我迄今为止最好的加速。将单个 vector 更改为 vector > 将某些东西的运行时间从 85 秒减少到 35 秒（Debian Lenny、Core2、测试中使用 TBB 3.0）。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（2）

ゞ花落谁相伴 2024-07-23 05:24:25

有一篇关于分配器的好论文：英特尔线程构建模块中可扩展多核软件的基础

我有限的经验：我使用 tbb::scalable_allocator 为我的 AI 应用程序重载了全局 new/delete 。但时间概况几乎没有变化。不过我没有比较内存使用情况。

回复收藏 0 原文

失与倦＂ 2024-07-23 05:24:25

您提到的解决方案针对 Intel CPU 进行了优化。它结合了特定的 CPU 机制来提高性能。

不久前，我发现了另一个非常有用的解决方案：STL 容器的快速 C++11 分配器。它在 VS2017 (~5x) 和 GCC (~7x) 上略微加快了 STL 容器的速度。它使用内存池进行元素分配，这使得它对所有平台都非常有效。

回复收藏 0 原文

~没有更多了~

关于作者

懒猫

暂无简介

文章

评论

27 人气

关注发私信

相关话题

更多

推荐作者

关注

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

更多

友情链接

文江博客

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文