sse

sse

文章 8 浏览 91

64 位特定 simd 内在函数

我在 SSE2 中使用以下联合声明。 typedef unsigned long uli typedef uli v4si __attribute__ ((vector_size(16))) typedef union { v4si v uli data[…

帅冕 2024-10-07 00:31:09 4 0

对齐类型并按值传递参数

按值传递对齐类型或具有对齐类型的结构不适用于某些实现。这会破坏 STL 容器,因为某些方法(例如 resize)按值获取参数。 我使用 Visual Studio 2008…

莫相离 2024-10-06 23:40:02 5 0

较高级别的 SSE 标志是否意味着 GCC / clang 中较低级别的标志?

例如,如果您使用 -msse4,这是否意味着它也将使用 -mssse3、-msse3、-msse2 等,或者您是否也必须显式添加这些标志?…

感性 2024-10-06 13:14:51 1 0

从 128 位 SSE 向量加载和提取 32 位整数值的最有效方法是什么?

我正在尝试使用 SSE 内在函数来优化我的代码,但遇到了一个问题,在完成 SSE 内在函数操作以获得我想要的结果后,我不知道从向量中提取整数值的好方法…

空城之時有危險 2024-10-06 07:33:24 3 0

SSE 移位整数

我试图了解 SSE 的转换是如何工作的,但我不明白 gdb 给我的输出。使用 SSE4,我有一个 128 位向量,其中包含 8 个 16 位无符号整数(使用 uint16_t)…

错爱 2024-10-02 13:16:38 3 0

使用 SSE 内在函数将 4 点积存储到 C 中的连续数组中的最有效方法

我正在使用 SSE 内在函数优化 Intel x86 Nehalem 微架构的一些代码。 我的程序的一部分计算 4 个点积,并将每个结果添加到数组的连续块中的先前值。更…

谁许谁一生繁华 2024-10-01 17:27:44 5 0

如何使用 C 中的 SSE 内在函数计算单向量点积

我试图将两个向量相乘,其中一个向量的每个元素都乘以另一个向量的相同索引中的元素。然后我想对结果向量的所有元素求和以获得一个数字。例如,向量 {…

九八野马 2024-10-01 05:50:46 5 0

SIMD 优化难题

我想使用 SIMD(SSE2 等)优化以下函数: int64_t fun(int64_t N, int size, int* p) { int64_t sum = 0 for(int i=1 i&ltsize i++) sum += (N/i)*p[i…

温柔戏命师 2024-09-29 10:45:46 3 0

我的编译器在做什么? (优化memcpy)

我正在使用 VC++2010 中的以下设置编译一些代码: /O2 /Ob2 /Oi /Ot 但是,我在理解生成的程序集的某些部分时遇到了一些问题,我在代码中提出了一些问…

铃予 2024-09-29 05:12:53 4 0

F# 中的 SSE3 指令

如何使用 SSE3 指令集并行化我的 F# 程序? F#编译器支持吗?…

月牙弯弯 2024-09-28 20:26:48 3 0

旧版本 GCC 上的 DPPS

嘿! 我需要优化 c 中的一些矩阵乘法代码,并且我正在使用 SSE 向量指令来完成它。我还发现 SSE4.1 已经有点积、dpps 指令。 问题是,在该软件应该可…

﹂绝世的画 2024-09-27 21:16:12 0 0

如何使用 SSE 内在函数将值存储在不连续的内存位置?

我对 SSE 非常陌生,并且已经使用内在函数优化了一段代码。我对操作本身很满意,但我正在寻找更好的方法来编写结果。结果最终包含在三个 _m128i 变量…

你另情深 2024-09-27 19:00:22 4 0

一个 SSE Stdlib 式的库?

一般来说,我在“网上”遇到的与 SSE/MMX 相关的所有内容都是向量和矩阵的数学内容。但是,我正在寻找 SSE 优化的“标准函数”库,例如 Agner Fog,或…

会傲 2024-09-25 19:31:08 9 0

GCC 中用于除法的 SIMD (SSE) 指令

如果可能的话,我想使用 SSE 指令优化以下代码片段: /* * the data structure */ typedef struct v3d v3d struct v3d { double x double y double z …

旧时模样 2024-09-25 15:19:35 2 0

sse 内联汇编与 g++

我正在尝试 g++ 内联汇编和 sse 并编写了第一个程序。它出现段错误 - 为什么? #include &ltstdio.h&gt float s[128*4] __attribute__((aligned(16)))…

椒妓 2024-09-18 22:39:52 4 0
更多

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文