Strassen 矩阵乘法算法

发布于 2024-08-15 03:13:04 字数 123 浏览 13 评论 0原文

有人能以直观的方式解释斯特拉森的矩阵乘法算法吗？我已经阅读了（好吧，试图阅读）书中和维基中的解释，但它没有点击楼上。网络上任何使用大量英语而不是正式符号等的链接也会有所帮助。是否有任何类比可以帮助我从头开始构建这个算法而无需记住它？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

为你拒绝所有暧昧 2024-08-22 03:13:04

考虑将两个 2x2 矩阵相乘，如下所示：

A B * E F = AE+BG AF+BH
C D   G H   CE+DG CF+DH

计算右侧的明显方法就是进行 8 次乘法和 4 次加法。但想象乘法比加法昂贵得多，因此我们希望尽可能减少乘法的次数。施特拉森使用一种技巧来计算右侧，减少一次乘法，增加大量加法（以及一些减法）。

以下是 7 次乘法：

M1 = (A + D) * (E + H) = AE + AH + DE + DH
M2 = (A + B) * H = AH + BH
M3 = (C + D) * E = CE + DE
M4 = A * (F - H) = AF - AH
M5 = D * (G - E) = DG - DE
M6 = (C - A) * (E + F) = CE + CF - AE - AF
M7 = (B - D) * (G + H) = BG + BH - DG - DH

因此，要计算 AE+BG，请从 M1+M7（这为我们提供 AE 和 BG 项）开始，然后添加/减去其他一些 Ms，直到剩下 AE+BG。奇迹般的是，M 的选择使得 M1+M7-M2+M5 起作用。与所需的其他 3 个结果相同。

现在要意识到这不仅适用于 2x2 矩阵，而且适用于 A..H 是子矩阵的任何（偶数）大小的矩阵。

Consider multiplying two 2x2 matrices, as follows:

A B * E F = AE+BG AF+BH
C D   G H   CE+DG CF+DH

The obvious way to compute the right side is just to do the 8 multiplies and 4 additions. But imagine multiplies are a lot more expensive than additions, so we want to reduce the number of multiplications if at all possible. Strassen uses a trick to compute the right hand side with one less multiply and a lot more additions (and some subtractions).

Here are the 7 multiplies:

M1 = (A + D) * (E + H) = AE + AH + DE + DH
M2 = (A + B) * H = AH + BH
M3 = (C + D) * E = CE + DE
M4 = A * (F - H) = AF - AH
M5 = D * (G - E) = DG - DE
M6 = (C - A) * (E + F) = CE + CF - AE - AF
M7 = (B - D) * (G + H) = BG + BH - DG - DH

So to compute AE+BG, start with M1+M7 (which gets us the AE and BG terms), then add/subtract some of the other Ms until AE+BG is all we are left with. Miraculously, the M's are chosen so that M1+M7-M2+M5 works. Same with the other 3 results required.

Now just realize this works not just for 2x2 matrices, but for any (even) sized matrices where the A..H are submatrices.

回复收藏 0 原文

长发绾君心 2024-08-22 03:13:04

在我看来，您需要了解 3 个想法：

您可以将矩阵拆分为多个块，然后像对数字矩阵一样对生成的块矩阵进行操作。特别是，您可以将两个这样的块矩阵相乘（当然，只要一个矩阵中的块行数与另一个中的块列数相匹配），并得到与原始数字矩阵相乘时相同的结果。
表达 2x2 块矩阵乘法结果所需的块具有足够的公因数，可以用比原始公式所暗示的更少的乘法来计算它们。这是托尼的回答中描述的技巧。
递归。

Strassen算法只是上述算法的一个应用。要理解其复杂性的分析，你需要阅读 Ronald Graham 的《具体数学》， Donald Knuth 和 Oren Patashnik 或类似的书。