当前位置：文江博客话题详情

有没有好的 x86 双精度小矩阵 SIMD 库？

发布于 2024-11-02 18:34:09 字数 351 浏览 6 评论 0原文

我正在寻找一个专注于图形小型 (4x4) 矩阵运算的 SIMD 库。那里有很多单精度，但我需要支持单精度和双精度。

我看过 Intel 的 IPP MX 库，但我更喜欢带有源代码的库。我对这些特定操作的 SSE3+ 实现非常感兴趣：

Mat4 * Mat4
Mat4 * Vec4
Mat4 * Mat4
Mat4 数组 * Vec4
Mat4 反转数组（很高兴拥有）

编辑：请不要“过早优化”答案。任何使用过小矩阵的人都知道，GCC 不会像手工优化的内在函数或 ASM 那样对它们进行矢量化。在这种情况下，这很重要，否则我不会问。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

不必你懂 2024-11-09 18:34:09

也许是 Eigen 库？

它支持SSE 2/3/4、ARM NEON和AltiVec指令集。

回复收藏 0 原文

变身佩奇 2024-11-09 18:34:09

Eigen 支持固定大小的矩阵。可以在堆栈上分配小型固定大小矩阵以获得更好的性能。 4x4 适合 SSE，因为 SSE 向量大小为 128 位。一行或一列 4 个双精度数字将均匀地适合 2x128 位 SSE 向量。这使得 SIMD 的实现变得容易。

另一种选择是自己编写代码。由于您的矩阵很小并且适合 L1 缓存，因此您不必担心大型矩阵所需的内存标题。您可以使用 AVX 获得更好的性能。较新版本的 GCC 和 Visual C++ 2010 支持 AVX 内在函数。 AVX向量大小为256位，可以恰好容纳4个双精度数字。

回复收藏 0 原文

你与清晨阳光 2024-11-09 18:34:09

尚未完全完成，但我想推介我自己的库 - glsl-sse2。

回复收藏 0 原文

司马昭之心 2024-11-09 18:34:09

此处有一个 4x4 AVX 实现。它是作为示例应用程序编写的，但我确信对于任何人来说，将有趣的部分提取到共享库中都不会太难。我想我会发布这个，尽管最初的问题已经很老了，对于未来任何在这里下车的人来说。

回复收藏 0 原文

赴月观长安 2024-11-09 18:34:09

如果您使用的是现代编译器，您可能不需要费心。大多数编译器的自动矢量化应该能够轻松地将具有固定边界的 for 循环转换为 SIMD 代码。 GCC 已经有这个相当长一段时间了，它是英特尔编译器的主要卖点（尽管如果您可能想使用 AMD 芯片，则在使用英特尔编译器时应该小心）。

回复收藏 0 原文

~没有更多了~

关于作者

萌面超妹

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

有没有好的 x86 双精度小矩阵 SIMD 库？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

有没有好的 x86 双精度小矩阵 SIMD 库？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。