sse/sse2 双矩阵浮点向量乘法

发布于 2024-10-19 12:45:11 字数 274 浏览 6 评论 0原文

我必须使用 sse/sse2 实现矩阵向量乘法。向量和矩阵很大。矩阵是双精度的，向量是浮点的。

关键是我必须在浮点数上进行的所有计算 - 当我从矩阵获取数据时，我将其提升为浮点数，进行计算并得到浮点数向量（稍后在对浮点数进行一些额外计算之后，我必须添加一些浮点数（float 我的问题是如何使用 SSE/SSE2 来做到这一点 - 问题是双精度数

- 我有指向 double* 的指针，我必须以某种方式将 4 个双精度数转换为 4 个浮点数以适合 __mm128 ...有任何说明可以做到这一点吗？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

断念 2024-10-26 12:45:11

您需要调用 __m128 _mm_cvtpd_ps (__m128d a) (CVTDP2PS) 两次以获取两个单精度浮点向量，每个向量包含两个原始双精度值，然后合并这两个使用例如 __m128 _mm_shuffle_ps(__m128 a, __m128 b, unsigned int imm8) (SHUFPS) 将向量浮点为单个向量。

回复收藏 0 原文

ぶ宁プ宁ぶ 2024-10-26 12:45:11

从 double 更改为 float 会降低精度级别，而不是提高精度级别。为了获得更高的准确性，您应该对 double 进行计算（将向量提升为该类型），然后可能将结果转换回 float。转换所需的指令为cvtps2pd（float 到double）和/或cvtpd2ps（double 到浮动）。它们一次只能转换两个值（因为 SSE 寄存器中只有两个 double ），因此您需要分两部分进行转换。