simd

simd

文章 0 浏览 2

逻辑 SSE 内在函数之间有什么区别?

不同类型的逻辑 SSE 内在函数之间有什么区别吗?例如,如果我们进行 OR 运算,则存在三个内在函数:_mm_or_ps、_mm_or_pd 和 _mm_or_si128 所有这些都…

滿滿的愛 2024-08-31 20:03:04 4 0

在 C++ 中实现 SIMD

我正在编写一些代码,并尝试尽可能地优化它,基本上让它在一定的时间限制下运行。 下面进行调用...... static affinity_partitioner ap parallel_for(…

稀香 2024-08-30 23:32:09 4 0

在 SSE2/SSSE3 上转置 8 个 16 位元素寄存器

(我是 SSE/asm 的新手,如果这是明显或多余的,我深表歉意) 是否有更好的方法来转置包含 16 位值的 8 个 SSE 寄存器,而不是执行 24 unpck[lh]ps 和…

維他命╮ 2024-08-26 18:09:16 2 0

Visual Studio 编译器标志 /arch 和性能

我刚刚注意到,在我们的项目中,“启用增强指令集”标志未设置,可能只是一个疏忽。 在启用该标志之前,我想问是否有人看到启用它后有任何实际性能改…

十级心震 2024-08-24 02:36:56 5 0

是否可以向量化 myNum += a[b[i]] * c[i];在 x86_64 上?

我将使用哪些内在函数在 x86_64 上对以下内容进行矢量化(如果甚至可以矢量化)? double myNum = 0 for(int i=0i&ltni++){ myNum += a[b[i]] * c[i] …

忆梦 2024-08-22 20:48:56 5 0

将两个x86 32位寄存器存储到128位xmm寄存器中

有没有更快的方法将两个 x86 32 位寄存器存储在一个 128 位 xmm 寄存器中? movd xmm0, edx movd xmm1, eax pshufd xmm0, xmm0, $1 por xmm0, xmm1 因…

兔小萌 2024-08-21 15:44:46 2 0

常见的 SIMD 技术

在哪里可以找到有关常见 SIMD 技巧的信息?我有一个指令集,并且知道如何编写不复杂的 SIMD 代码,但我知道,SIMD 现在更加强大。它可以容纳复杂的条…

场罚期间 2024-08-20 00:16:16 4 0

如何使用 128 位 C 变量和 xmm 128 位 asm?

在 gcc 中,我想通过 asm 代码对 2 个 C 变量进行 128 位异或:如何? asm ( "movdqa %1, %%xmm1" "movdqa %0, %%xmm0" "pxor %%xmm1,%%xmm0" "movdqa…

贩梦商人 2024-08-16 11:56:16 2 0

利用 SSE 和其他 CPU 扩展

在我的代码库中有几个地方,对于大型数据集,相同的操作会重复很多次。在某些情况下,处理这些需要花费相当长的时间。 我相信使用SSE来实现这些循环应…

遇见了你 2024-08-14 11:08:22 2 0

目前哪些汇编器支持 AVX 指令集?

我想开始使用一些 AVX(高级矢量扩展)指令。我知道英特尔提供了一个模拟器来测试包含这些指令的软件(请参阅这个问题),但由于我不想手动编写十六进…

清晰传感 2024-08-11 08:59:14 5 0

使用 GCC 进行循环版本控制

我正在使用 GCC 进行自动矢量化。由于客户要求,我无法使用内在函数或属性。 (我无法获取用户输入来支持向量化) 如果可以向量化的数组的对齐信息未…

゛清羽墨安 2024-08-11 08:22:33 3 0

如果我对一堆哈希值进行哈希处理,哈希冲突的可能性有多大?

假设我使用哈希来识别文件,所以我不需要它是安全的,我只需要最大限度地减少冲突。我当时想,我可以通过使用 SIMD 并行运行四个散列,然后对最终结果…

如果没有你 2024-08-10 03:50:23 2 0

Mono.Simd Vector3(浮点数)丢失?

嘿亚,我正在尝试使用 Mono 的 SIMD 来处理我的项目中的坐标(X,Y,Z), 但我只看到对 Vector2 和 Vector4 类型的支持。有没有人遇到过这个问题,有…

ま柒月 2024-08-09 04:26:02 2 0

快速寄存器内排序字节?

给定 4 个字节的寄存器(对于 SIMD,为 16 个字节),必须有一种有效的方法来使用一些指令对寄存器中的字节进行排序。 提前致谢。…

凉城已无爱 2024-08-07 23:15:58 1 0

从 Haskell 生成矢量代码?

是否有可能让 GHC 为各个 SSE 代生成 SIMD 代码? 例如。得到这样的程序, import Data.Array.Vector main = print . sumU $ (enumFromToFracU 1 1000…

如梦亦如幻 2024-08-05 18:17:10 3 0
更多

推荐作者

qq_FjTq5B

文章 0 评论 0

18273202778

文章 0 评论 0

WordPress小学生

文章 0 评论 0

〃温暖了心ぐ

文章 0 评论 0

迷乱花海

文章 0 评论 0

niuniu

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文