当前位置：文江博客话题详情

“动态存储”与memcpy

发布于 2024-12-12 18:25:03 字数 251 浏览 3 评论 0原文

我正在使用一个库，该库使用“memcpy”来模拟可直接访问的动态存储数据结构。值得注意的是，我正在研究小数据集产生的数值运算。如何确定链表在效率方面是否比 memcpy 更合适？

从我在文献和网上发现的情况来看，基准被认为是相当邪恶的。

我正在处理大约 30 个小尺寸元素（根据经验）（3 个分量向量：空间中的点）。

在这种情况下你会使用什么：

1）memcpy +直接访问 2）链表+线性搜索时间

谢谢！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

十年九夏 2024-12-19 18:25:03

如果你真的那么关心性能，你应该测量它，即对你的代码进行基准测试（这不是邪恶的，这是常见的做法；邪恶的是过早的优化）。

但请注意，至少对于 GNU/Linux 上的最新 GCC（例如 GCC 4.6），并且至少通过 -O2、memcpy 和 -O2 进行优化时。 memset 半神奇地（通过 __builtin_memcpy 或类似技巧）转换为非常高效的代码。

对于大量的小数据元素，我猜想缓存考虑因素是性能的主导因素。

回复收藏 0 原文

从此见与不见 2024-12-19 18:25:03

分析或基准测试不是邪恶的。它们是找出更多选项中哪一个更有效的最佳方法。随着当今优化器的“智能”，反直觉的选择实际上可能被证明是最有效的。我建议您运行一个基准测试并根据该基准进行选择。唯一可能出错的方法是不提供有效的输入，这涵盖了大多数情况。

回复收藏 0 原文

战皆罪 2024-12-19 18:25:03

当您处理如此少量的数据时，您为什么要担心？

基准测试仅适用于大量计算 - 以限制操作系统的其他影响。

回复收藏 0 原文

乙白 2024-12-19 18:25:03

对于如此小的数据集（30 * 12 字节），所有数据都位于缓存行内。所以我确信它会比列表更快。如果您使用列表，您仍然需要分配一块内存，在大多数操作系统上，这比复制这么小的一块内存需要更多的时间。

回复收藏 0 原文

~没有更多了~

关于作者

沉鱼一梦

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

“动态存储”与memcpy

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

“动态存储”与memcpy

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。