当前位置：文江博客话题详情

performance matrix pointers c++ inversion

性能问题：就地反转指针数组与值数组

发布于 2024-10-11 06:22:59 字数 680 浏览 2 评论 0原文

提出这个问题的背景是我正在求解线性方程组 (Ax=b)，其中 A 是矩阵（通常尺寸小于 100x100），x 和 b 是向量。我使用的是直接法，这意味着我首先反转 A，然后通过 x=A^(-1)b 求解。在迭代过程中重复该步骤直至收敛。

我现在使用矩阵库（MTL4）的方式：
对于每次迭代，我将 A （值）的所有系数复制到矩阵对象中，然后反转。这是最简单、最安全的选择。

改用指针数组：
对于我的特定情况，A 的系数恰好在每次迭代之间更新。这些系数存储在不同的变量中（有些是数组，有些不是）。如果我将 A 设置为包含指向这些系数变量的指针的数组，然后就地反转 A，是否会有潜在的性能提升？

最后一个选项的好处是，一旦我在第一次迭代之前在 A 中设置了指针，我就不需要在连续迭代之间复制任何值。 A 中指向的值将在迭代之间自动更新。

因此，在我看来，性能问题归结为：
- 假设指针的取消引用并不昂贵，则矩阵求逆过程花费的时间大致相同。
- 指针数组不需要额外的内存来存储包含值的矩阵 A。
- 指针数组选项不必在每次迭代之间复制 A 的所有 NxN 值。
- 指向指针数组选项的值通常在内存中不排序。希望所有值在内存中都相对较近，但 *A[0][1] 通常不在 *A[0][0] 旁边，等等。

对此有什么评论吗？最后一句话是否会对绩效产生负面影响，从而权衡积极的绩效影响？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

伪装你 2024-10-18 06:22:59

测试，测试，测试。

尤其是在数值线性代数领域。有许多效果在发挥作用，这就是为什么有许多优化库可以为您解决这个负担。

需要考虑的一些影响：

内存局部性和缓存影响
多线程影响（一些在单核运行时最佳的算法，在使用多个核心时会导致内存冲突/缓存驱逐）。

测试是无可替代的。

回复收藏 0 原文

伴我心暖 2024-10-18 06:22:59

以下是一些评论：

用于反转的函数是否能够处理指针矩阵而不是值矩阵？如果它没有意识到必须进行间接寻址，则可能会发生各种奇怪的效果。
当进行就地矩阵求逆（意味着求逆矩阵覆盖输入矩阵）时，所有输入系数都将被新值覆盖，因为矩阵求逆不能通过重新排序元素来完成矩阵。
在反演过程中，外部过程不会改变任何输入系数。所有此类更新都必须在迭代之间执行。

因此，当您选择指针解决方案时，您会遇到以下一组权衡：

组成矩阵 A 的系数不能再与矩阵求逆异步计算。
每次迭代都必须重新计算所有系数（当您使用就地求逆时，意味着求逆矩阵使用与输入矩阵相同的内存），或者您仍然必须使用 N x 矩阵用于保存反转结果的 N 个值。

回复收藏 0 原文

波浪屿的海角声 2024-10-18 06:22:59

您在这里得到了很好的答案。我唯一要补充的是一些有关性能的一般经验。

您正在先验地考虑性能。这是合理的，但真正的回报是事后的。换句话说，在运行的代码告诉您之前，您无法确定真正的优化机会在哪里。

您不知道大部分时间是否会花费在矩阵求逆、乘法、复制矩阵、取消引用或其他操作上。人们可以猜测。如果我必须猜的话，那就是矩阵求逆，因为它是 100x100。
然而，我无法猜测其他的东西可能会更大。
猜测的记录非常糟糕，尤其是当您可以找出时。

以下是我的意思的示例。

回复收藏 0 原文

~没有更多了~

关于作者

感情旳空白

暂无简介

0 文章

0 评论

2461 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

linfzu01

文章 0 评论 0

§对你不离不弃

文章 0 评论 0

可遇━不可求

文章 0 评论 0

枕梦

文章 0 评论 0

qq_3LFa8Q

文章 0 评论 0

JP

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文