第 4 页 - simd - 文江博客

simd

文章 0 浏览 6

矢量化 (SIMD) 树运算

关于向量化树操作的一般提示/指针有哪些？内存布局明智、算法明智等。一些特定于领域的内容：每个父节点将有相当多（20 - 200）个子节点。每个节点…

恰似旧人归 2024-12-01 13:09:57 5 0

在C++中执行SSE时编译错误

我的代码对于理解SSE来说非常简单。我的代码是： #include #include #include using namespace std; struct cVector { float x,y,z; }; int main() { …

反目相谮 2024-12-01 12:38:50 3 0

如何交换256位AVX（YMM）寄存器中的低128位和高128位

我正在移植 SSE SIMD 代码以使用 256 位 AVX 扩展，但似乎找不到任何可以混合/洗牌/移动高 128 位和低 128 位的指令。背景故事：我真正想要的是 VHA…

丑丑阿 2024-12-01 09:54:07 2 0

在哪里可以找到列出 SSE 内在函数操作的官方参考资料？

是否有官方参考列出了 GCC 的 SSE 内在函数的操作，即中的函数？头文件？…

战皆罪 2024-12-01 04:34:04 5 0

SSE 优化代码的性能与普通版本类似

我想迈出使用英特尔 SSE 的第一步，因此我遵循了发布的指南此处，区别在于，我不是为 Windows 和 C++ 开发，而是为 Linux 和 C 开发（因此我不使用任…

梦过后 2024-11-29 07:08:35 6 0

_mm_mul_ps 无法正确地将 10001 与 10001 相乘，但可以将 10000 与 10000 相乘

我有一个非常简单的程序来乘四个数字。有用当它们每个都是 10000 时很好，但如果我将它们更改为 10001，则不行。结果会减少 1。我在 AMD Opteron 和…

不甘平庸 2024-11-29 06:03:08 3 0

进行水平 SSE 向量和（或其他简化）的最快方法

给定一个由三个（或四个）浮点数组成的向量。对它们求和的最快方法是什么？ SSE（movaps、shuffle、add、movd）总是比 x87 快吗？ SSE3 中的水平相加…

蓝颜夕 2024-11-29 04:36:41 3 0

将 JNI Java 数组类型转换为 NEON

我确信人们总是这样做，但我在这里遇到了困难。我将浮点数组传递给 JNI 函数，但随后我打算使用 ARM 的 NEON SIMD 功能对此数组执行一些操作。无论如…

影子的影子 2024-11-28 19:39:49 2 0

如何使用 SIMD 比较两个向量并获得单个布尔结果？

我有两个分别包含 4 个整数的向量，我想使用 SIMD 命令来比较它们（假设根据比较结果生成一个结果向量，其中每个条目为 0 或 1）。然后，我想将结果…

迎风吟唱 2024-11-27 08:53:45 2 0

免费/开源 C/C++矢量化数学函数库？

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…

酒与心事 2024-11-27 02:11:50 2 0

在代码中引入 SIMD 命令时遇到问题

我有一个基本的计算函数，应用于数组中的每个项目。该函数不仅仅只是对两个向量求和。我想使用 SIMD 命令并行处理数组中的多个项目。因为我发现这些…

阳光①夏 2024-11-26 23:53:24 2 0

如何在 Visual Studio 2010 中添加 SIMD 相关编译器标志

我找到了这个标志列表： http://www.ncsa.illinois.edu/UserInfo/Resources/Software/Intel/Compilers/10.0/main_for/mergedProjects/optaps_for/comm…

疾风者 2024-11-26 23:26:04 5 0

我如何知道矢量函数 (SIMD) 是否真的同时适用于多个对象？

我试图了解我的编译器是否将我的向量表示法解释为单个对象（相当于 for 循环）或一次处理多个数据。有谁知道我该怎么做？我在 Visual Studio 2010 上…

救星 2024-11-26 20:52:54 1 0

有效地将大复数向量乘以标量 C++

我目前正在尝试最有效地对复数数组（内存对齐方式与 std::complex 相同，但当前使用我们自己的 ADT）与相同的标量值数组进行就地乘法size 作为复数数…

仙女 2024-11-26 17:56:16 2 0

MOVDQA 和 MOVAPS x86 指令之间的区别？

我正在查找英特尔数据表：英特尔® 64 和 IA-32 架构软件开发人员手册，我找不到 MOVDQA：移动对齐双四字 MOVAPS：移动对齐打包单精度之间的区别在英…

节枝 2024-11-19 20:04:12 9 0

共 10 页
上一页
2
3
4
5
6
下一页

忆悲凉

文章 0 评论 0

关注

hgfg1645

文章 0 评论 0

关注

qq_qLPLYi

文章 0 评论 0

关注

戏舞

文章 0 评论 0

关注

殊姿

文章 0 评论 0

关注

﹂绝世的画

文章 0 评论 0

友情链接

文江博客

simd

矢量化 (SIMD) 树运算

在C++中执行SSE时编译错误

如何交换256位AVX（YMM）寄存器中的低128位和高128位

在哪里可以找到列出 SSE 内在函数操作的官方参考资料？

SSE 优化代码的性能与普通版本类似

_mm_mul_ps 无法正确地将 10001 与 10001 相乘，但可以将 10000 与 10000 相乘

进行水平 SSE 向量和（或其他简化）的最快方法

将 JNI Java 数组类型转换为 NEON

如何使用 SIMD 比较两个向量并获得单个布尔结果？

免费/开源 C/C++矢量化数学函数库？

在代码中引入 SIMD 命令时遇到问题

如何在 Visual Studio 2010 中添加 SIMD 相关编译器标志

我如何知道矢量函数 (SIMD) 是否真的同时适用于多个对象？

有效地将大复数向量乘以标量 C++

MOVDQA 和 MOVAPS x86 指令之间的区别？

热门标签

推荐作者

忆悲凉

hgfg1645

qq_qLPLYi

戏舞

殊姿

﹂绝世的画

友情链接