simd

simd

文章 0 浏览 2

gcc 中的 SSE(SIMD 扩展)支持

我看到如下代码: #include "stdio.h" #define VECTOR_SIZE 4 typedef float v4sf __attribute__ ((vector_size(sizeof(float)*VECTOR_SIZE))) // vec…

甜味拾荒者 2024-10-10 11:24:30 0 0

如何让下面的代码更快

int u1, u2 unsigned long elm1[20], _mulpre[16][20], res1[40], res2[40] 64 bits long res1, res2 initialized to zero. l = 60 while (l) { for (…

浅笑轻吟梦一曲 2024-10-08 09:19:09 0 0

SSE2:双精度对数函数

我需要日志函数的开源(无许可证限制)实现,带有签名的东西 __m128d _mm_log_pd(__m128d) 可以在英特尔短向量数学库(ICC的一部分)中找到,但ICC既…

春风十里 2024-10-08 01:35:25 0 0

SIMD 代码与标量代码

以下循环执行数百次。 &lt代码&gt elma 和 elmc 都是无符号长(64 位)数组,res1 和 res2 也是如此。 unsigned long simdstore[2] __m128i *p, simda…

梦纸 2024-10-07 03:19:24 0 0

64 位特定 simd 内在函数

我在 SSE2 中使用以下联合声明。 typedef unsigned long uli typedef uli v4si __attribute__ ((vector_size(16))) typedef union { v4si v uli data[…

帅冕 2024-10-07 00:31:09 0 0

将 MMX/SSE 指令移植到 AltiVec

我在 ASM 方面的经验极其有限,在 SIMD 方面的经验就更少了。 但碰巧我有以下 MMX/SSE 优化代码,我想将其移植到 AltiVec 指令以在 PPC/Cell 处理器上…

少女净妖师 2024-10-06 14:32:21 1 0

从 128 位 SSE 向量加载和提取 32 位整数值的最有效方法是什么?

我正在尝试使用 SSE 内在函数来优化我的代码,但遇到了一个问题,在完成 SSE 内在函数操作以获得我想要的结果后,我不知道从向量中提取整数值的好方法…

空城之時有危險 2024-10-06 07:33:24 0 0

使用 SSE 优化有限差分

我想知道是否可以使用 SSE (1,2,3,4,...) 来优化以下循环: // u and v are allocated through new double[size*size] for (int j = l j &lt size-1 +…

一桥轻雨一伞开 2024-10-03 02:32:40 1 0

使用 SSE 内在函数将 4 点积存储到 C 中的连续数组中的最有效方法

我正在使用 SSE 内在函数优化 Intel x86 Nehalem 微架构的一些代码。 我的程序的一部分计算 4 个点积,并将每个结果添加到数组的连续块中的先前值。更…

谁许谁一生繁华 2024-10-01 17:27:44 1 0

如何使用 C 中的 SSE 内在函数计算单向量点积

我试图将两个向量相乘,其中一个向量的每个元素都乘以另一个向量的相同索引中的元素。然后我想对结果向量的所有元素求和以获得一个数字。例如,向量 {…

九八野马 2024-10-01 05:50:46 0 0

ARM Cortex-A8:VFP 和 NEON 有什么区别

在ARM Cortex-A8处理器中,我了解NEON是什么,它是一个SIMD协处理器。 但同时也是协处理器的VFP(矢量浮点)单元是否可以用作SIMD处理器呢?如果可以…

云裳 2024-09-30 18:28:04 1 0

SIMD 优化难题

我想使用 SIMD(SSE2 等)优化以下函数: int64_t fun(int64_t N, int size, int* p) { int64_t sum = 0 for(int i=1 i&ltsize i++) sum += (N/i)*p[i…

温柔戏命师 2024-09-29 10:45:46 0 0

c++如何编写编译器可以轻松针对 SIMD 进行优化的代码?

我正在 Visual Studio 2008 中工作,在项目设置中我看到“激活扩展指令集”选项,我可以将其设置为“无”、“SSE”或“SSE2”, 因此编译器将尝试将指…

转身以后 2024-09-29 00:30:29 2 0

GCC 中用于除法的 SIMD (SSE) 指令

如果可能的话,我想使用 SSE 指令优化以下代码片段: /* * the data structure */ typedef struct v3d v3d struct v3d { double x double y double z …

旧时模样 2024-09-25 15:19:35 0 0

如何在 iPad A4 处理器上执行整数 SIMD 运算?

我觉得需要速度。双 for 循环正在降低我的 iPad 应用程序的性能。我需要SIMD。如何在 iPad A4 处理器上执行整数 SIMD 运算? 谢谢, 道格…

唯憾梦倾城 2024-09-25 12:34:31 0 0
更多

推荐作者

lioqio

文章 0 评论 0

Single

文章 0 评论 0

禾厶谷欠

文章 0 评论 0

alipaysp_2zg8elfGgC

文章 0 评论 0

qq_N6d4X7

文章 0 评论 0

放低过去

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文