simd

simd

文章 0 浏览 3

c++如何编写编译器可以轻松针对 SIMD 进行优化的代码?

我正在 Visual Studio 2008 中工作,在项目设置中我看到“激活扩展指令集”选项,我可以将其设置为“无”、“SSE”或“SSE2”, 因此编译器将尝试将指…

转身以后 2024-09-29 00:30:29 3 0

GCC 中用于除法的 SIMD (SSE) 指令

如果可能的话,我想使用 SSE 指令优化以下代码片段: /* * the data structure */ typedef struct v3d v3d struct v3d { double x double y double z …

旧时模样 2024-09-25 15:19:35 2 0

如何在 iPad A4 处理器上执行整数 SIMD 运算?

我觉得需要速度。双 for 循环正在降低我的 iPad 应用程序的性能。我需要SIMD。如何在 iPad A4 处理器上执行整数 SIMD 运算? 谢谢, 道格…

唯憾梦倾城 2024-09-25 12:34:31 4 0

如何使用NEON比较(大于或等于)指令?

一般如何使用 NEON 比较指令? 这是一个案例,我想使用大于或等于指令? 目前我有一个, int x ... ... ... if(x &gt= 0) { .... } 在NEON中,我想以…

只怪假的太真实 2024-09-24 23:16:50 6 0

SSE2内在函数:直接访问内存

许多 SSE 指令允许源操作数是 16 字节对齐的内存地址。例如,各种(拆)包指令。 PUNCKLBW 具有以下签名: PUNPCKLBW xmm1,xmm2/m128 现在这对于内在…

谜兔 2024-09-12 13:16:21 3 0

SSE 访问违规

我有代码: float *mu_x_ptr __m128 *tmp __m128 *mm_mu_x mu_x_ptr = _aligned_malloc(4*sizeof(float), 16) mm_mu_x = (__m128*) mu_x_ptr for(row …

薄荷梦 2024-09-12 10:06:37 3 0

上交所挤满的流通股上翻转标志

我正在寻找最有效的方法来翻转 SSE 寄存器中所有四个浮点数的符号。 我没有在英特尔架构软件开发手册中找到执行此操作的内在函数。以下是我已经尝试过…

凡间太子 2024-09-12 07:07:51 6 0

如何使用 NEON SIMD 合并 2 行元素?

我有一个 A = a1 a2 a3 a4 b1 b2 b3 b4 c1 c2 c3 c4 d1 d2 d3 d4 我有 2 行, float32x2_t a = a1 a2 float32x2_t b = b1 b2 从这些我如何得到 - floa…

野侃 2024-09-11 05:58:51 5 0

如何使用 Eigen,C++线性代数的模板库?

我有一个由矩阵组成的图像处理算法,我有自己的矩阵运算代码(乘法、逆...)。但我使用的处理器是ARM​​ Cortex-A8处理器,它有用于矢量化的NEON协处…

_蜘蛛 2024-09-10 00:10:58 6 0

如何在 ARM Cortex-a8 中使用乘法和累加内在函数?

如何使用GCC提供的乘累加内在函数? float32x4_t vmlaq_f32 (float32x4_t , float32x4_t , float32x4_t) 谁能解释一下我必须传递给这个函数的三个参数…

就像说晚安 2024-09-09 15:58:39 3 0

使用 sse 指令进行复杂的 Mul 和 Div

通过 SSE 指令执行复杂的乘法和除法是否有益? 我知道使用 SSE 时加法和减法表现更好。有人可以告诉我如何使用 SSE 执行复杂的乘法以获得更好的性能吗…

橙幽之幻 2024-09-08 18:32:01 6 0

SIMD/SSE 新手:简单的图像过滤

我对 SIMD/SSE 很陌生,我正在尝试做一些简单的图像过滤(模糊)。 下面的代码在水平方向上使用简单的 [1 2 1] 权重过滤 8 位灰度位图的每个像素。我…

幸福还没到 2024-09-07 10:04:27 2 0

如何将全 1 加载到 mmx 寄存器中?为什么这不起作用?

当我搜索时,除了关于 64/32 位内容的意见问题之外,似乎找不到任何其他内容。 __asm__ { mov rbx, 0xFFFFffffFFFFffffull movq mm2, rbx } 根据我的 …

三月梨花 2024-09-07 06:29:16 6 0

Ruby SIMD 和上证所

我想知道是否有一种方法可以扩展 ruby​​ 数组类型来执行 SIMD 和 SIMD 操作。 SSE向量计算。 我的意思是用低级语言实现,以便在 ruby​​ 程序中使…

因为看清所以看轻 2024-09-07 01:30:36 1 0

快速24位数组-> 32位数组转换?

快速摘要: 我有一个 24 位值的数组。关于如何快速将各个 24 位数组元素扩展为 32 位元素,有什么建议吗? 详细信息: 我正在使用 DirectX 10 中的像…

走走停停 2024-09-04 15:13:01 3 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文