simd

simd

文章 0 浏览 6

使用 sse 指令进行复杂的 Mul 和 Div

通过 SSE 指令执行复杂的乘法和除法是否有益? 我知道使用 SSE 时加法和减法表现更好。有人可以告诉我如何使用 SSE 执行复杂的乘法以获得更好的性能吗…

橙幽之幻 2024-09-08 18:32:01 16 0

SIMD/SSE 新手:简单的图像过滤

我对 SIMD/SSE 很陌生,我正在尝试做一些简单的图像过滤(模糊)。 下面的代码在水平方向上使用简单的 [1 2 1] 权重过滤 8 位灰度位图的每个像素。我…

幸福还没到 2024-09-07 10:04:27 7 0

如何将全 1 加载到 mmx 寄存器中?为什么这不起作用?

当我搜索时,除了关于 64/32 位内容的意见问题之外,似乎找不到任何其他内容。 __asm__ { mov rbx, 0xFFFFffffFFFFffffull movq mm2, rbx } 根据我的 …

三月梨花 2024-09-07 06:29:16 11 0

Ruby SIMD 和上证所

我想知道是否有一种方法可以扩展 ruby​​ 数组类型来执行 SIMD 和 SIMD 操作。 SSE向量计算。 我的意思是用低级语言实现,以便在 ruby​​ 程序中使…

因为看清所以看轻 2024-09-07 01:30:36 9 0

快速24位数组-> 32位数组转换?

快速摘要: 我有一个 24 位值的数组。关于如何快速将各个 24 位数组元素扩展为 32 位元素,有什么建议吗? 详细信息: 我正在使用 DirectX 10 中的像…

走走停停 2024-09-04 15:13:01 10 0

C++快速将 2 个数组加在一起

给定数组: int canvas[10][10]; int addon[10][10]; 所有值的范围为 0 - 100,在 C++ 中添加这两个数组的最快方法是什么,以便画布中的每个单元格等…

氛圍 2024-09-03 21:38:41 12 0

SSE SIMD 优化 For 循环

我在循环中有一些代码 for(int i = 0; i < n; i++) { u[i] = c * u[i] + s * b[i]; } 所以,u 和 b 是相同长度的向量,c 和 s 是标量。该代码是否适合…

燕归巢 2024-09-02 18:27:19 10 0

同时使用多个 SIMD 指令集的好处

我正在编写一个高度并行的多线程应用程序。我已经写好了一个SSE加速线程类。如果我要编写一个 MMX 加速线程类,然后同时运行这两个线程(每个核心一个…

绿萝 2024-09-01 20:00:49 13 0

逻辑 SSE 内在函数之间有什么区别?

不同类型的逻辑 SSE 内在函数之间有什么区别吗?例如,如果我们进行 OR 运算,则存在三个内在函数:_mm_or_ps、_mm_or_pd 和 _mm_or_si128 所有这些都…

滿滿的愛 2024-08-31 20:03:04 16 0

在 C++ 中实现 SIMD

我正在编写一些代码,并尝试尽可能地优化它,基本上让它在一定的时间限制下运行。 下面进行调用...... static affinity_partitioner ap; parallel_for…

稀香 2024-08-30 23:32:09 14 0

在 SSE2/SSSE3 上转置 8 个 16 位元素寄存器

(我是 SSE/asm 的新手,如果这是明显或多余的,我深表歉意) 是否有更好的方法来转置包含 16 位值的 8 个 SSE 寄存器,而不是执行 24 unpck[lh]ps 和…

維他命╮ 2024-08-26 18:09:16 9 0

Visual Studio 编译器标志 /arch 和性能

我刚刚注意到,在我们的项目中,“启用增强指令集”标志未设置,可能只是一个疏忽。 在启用该标志之前,我想问是否有人看到启用它后有任何实际性能改…

十级心震 2024-08-24 02:36:56 9 0

是否可以向量化 myNum += a[b[i]] * c[i];在 x86_64 上?

我将使用哪些内在函数在 x86_64 上对以下内容进行矢量化(如果甚至可以矢量化)? double myNum = 0; for(int i=0;i

忆梦 2024-08-22 20:48:56 15 0

将两个x86 32位寄存器存储到128位xmm寄存器中

有没有更快的方法将两个 x86 32 位寄存器存储在一个 128 位 xmm 寄存器中? movd xmm0, edx movd xmm1, eax pshufd xmm0, xmm0, $1 por xmm0, xmm1 因…

兔小萌 2024-08-21 15:44:46 7 0

常见的 SIMD 技术

在哪里可以找到有关常见 SIMD 技巧的信息?我有一个指令集,并且知道如何编写不复杂的 SIMD 代码,但我知道,SIMD 现在更加强大。它可以容纳复杂的条…

场罚期间 2024-08-20 00:16:16 13 0
更多

推荐作者

Promise

文章 0 评论 0

qq_lbRlsh

文章 0 评论 0

待"谢繁草

文章 0 评论 0

yy2010hell

文章 0 评论 0

漫无边际

文章 0 评论 0

傲娇萝莉攻

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文