simd

投稿关注

文章 0 浏览 6

矢量类库：解决使用 vec4d 时的问题

这是一段导致我出现问题/错误的简化代码（Vec4d 来自 Agner Fog 库 VCL） #define AVX256_ALIGNED_MALLOC(type,size) (type *)_aligned_malloc(size *…

南城旧梦 2025-01-13 00:26:24 0 0

OpenMP pragma 的含义是：不要矢量化

我有一个行程计数非常低的循环，其中矢量化没有效果，但编译器仍然对其进行矢量化。是否有一种可移植的方法来告诉编译器不要对循环进行矢量化，与#pra…

毁虫ゝ 2025-01-12 15:27:57 0 0

当数字为指定幂时计算数组中数字的向量化函数

我正在尝试矢量化这个相当昂贵的函数（Scaler 现在正在工作！）： template inline constexpr bool isPower(const N n, const POW p) noexcept { doub…

弱骨蛰伏 2025-01-12 14:27:52 0 0

asm x86_64 Intel Linux - 将 RDX:RAX 移至 XMM0

我正在使用 rdtsc 指令，我知道它将高四字存储到 RDX 中，将低四字存储到 RAX (RDX:RAX) 中，但我想用这个进行算术运算（两个时间戳相减）所以我需要…

三生一梦 2025-01-12 02:41:55 0 0

打印 __m128i 变量

我正在尝试学习使用内在函数进行编码，下面是一个代码，它执行加法使用的编译器：icc #include #include int main() { __m128i a = _mm_set_epi32(1,…

往事风中埋 2025-01-11 21:57:16 0 0

按位异或运算和 popcount 的 AVX 性能较慢

我刚开始编写一些基于 avx 内在函数的代码，因此需要一些帮助来理解我的观察结果是否符合预期。我有两种实现距离计算的方法，这两种方法都采用 2 个浮…

剪不断理还乱 2025-01-09 05:44:38 1 0

如何在C6678 DSP上使用SSE指令集？

SSE 只能在 x86 x64 CPU 上使用。我在 TI C6678 上使用 SPEEXDSP 库时遇到问题。我从来没有使用过SSE指令，我尝试了很多方法，但无法让它在DSP上工作…

韵柒 2025-01-09 02:39:27 1 0

gcc 编译器开关 (-mavx -mavx2 -mavx512f) 到底有什么作用？

我在 C/C++ 代码中明确使用了英特尔 SIMD 内在扩展。为了编译代码，我需要在命令行上指定 -mavx、-mavx512 或类似的内容。我对这一切都很满意。然而…

挖个坑埋了你 2025-01-09 00:30:32 1 0

__builtin_clz 的实现

GCC (4.6+) __builtin_clz 的实现是什么？它是否对应于 Intel x86_64 (AVX) 上的某些 CPU 指令？…

陌上芳菲 2025-01-07 07:35:46 1 0

为 GCC 向量扩展加载数据

GCC 的向量扩展提供了一种很好的、相当可移植的方式来访问不同硬件架构上的一些 SIMD 指令，而无需诉诸硬件特定的内在函数（或自动矢量化）。一…

奶气 2025-01-06 13:09:15 1 0

SIMD (AVX) 比较

用于比较 __m256 和 __m256i（AVX 指令集）的 gcc 内部函数的名称是什么？…

当梦初醒 2025-01-06 12:29:18 1 0

使用 SIMD 指令进行平滑样条

我在代码中使用这种类型的样条，我想知道该算法是否可以受益来自SIMD指令的使用。（ARM 上的 NEON）使用的代码是以下源代码的 C 翻译（Fortran 语言…

后eg是否自 2025-01-03 08:47:07 1 0

SIMD 架构下可以加速 Raymarching 吗？

答案似乎是否定的，因为光线行进是高度有条件的，即每条光线都遵循唯一的执行路径，因为在每个步骤中我们都会检查不透明度、终止等，这些将根据单个光…

何必那么矫情 2025-01-02 14:05:55 3 0

ARM NEON：比较 128 位值

我感兴趣的是找到比较 Cortex-A9 内核（允许使用 VFP 指令）上 NEON 寄存器（例如 Q0 和 Q3）中存储的值的最快方法（最低周期数）。到目前为止，我有…

平生欢 2024-12-29 21:04:54 3 0

SIMD 的优先选择是始终摆脱分支吗？

如果您正在编写一些将由另一个程序运行的 SIMD 代码，那么摆脱分支以提高性能是否总是有利的？我听说即使只是为了避免 if/else 语句等而进行额外的操…

囍笑 2024-12-27 16:26:27 2 0

共 10 页
1
2
3
4
5
下一页

友情链接

文江博客