sse

sse

文章 8 浏览 95

固有的倒数为_mm_movemask_epi8

因此,首先,我将仅描述任务: 我需要: 比较两个 __ M128i 。 以某种方式使用特定 uint16_t 值(可能使用 _mm_movemask_epi8 首先使用 _mm_movemask_…

淡莣 2025-02-13 15:26:09 1 0

在UINT64到双转换上:为什么右移动后的代码更简单1?

为什么 asdouble1 比 asdouble0 要简单得多? // AsDouble0(unsigned long): # @AsDouble0(unsigned long) // movq xmm1, rdi // punpckldq xmm1, xmm…

绿光 2025-02-13 05:07:30 1 0

AVX2 8浮子寄存器和洗牌配对寄存器的水平分钟

在8宽SIMD中的Ray VS三角形交叉测试之后,我将在下面的标量中更新T,U和V(求出最低的t和更新t,u,v,如果低于以前的t)。有没有办法在SIMD而不是标…

树深时见影 2025-02-12 19:16:42 2 0

_mm_loadu_si32在Ubuntu上未被GCC识别

当我尝试使用 _MM_LOADU_SI32 时,VSCODE给出了错误消息: 类型“ int”的值不能用于初始化类型的实体“ __m128i 尝试编译时,我会收到错误消息: 函…

口干舌燥 2025-02-12 13:21:59 0 0

AVX与SSE:期望看到更大的加速

我希望AVX比SSE快1.5倍。所有3个阵列(3个阵列 * 16384元素 * 4个字节/元素= 196608字节)应适合L2缓存(256KB)在Intel Core CPU(Broadwell)上。 …

情徒 2025-02-12 09:09:12 1 0

SSE Interleave/Merge/合并2个向量,使用掩码,每个元素的条件移动?

本质上,我试图在2 SSE( __ M128 )向量上实现类似三元的操作。 掩码是另一个 __ M128 从 _MM_CMPLT_PS 获得的向量。 我要实现的是选择vector a 的元…

一腔孤↑勇 2025-02-10 13:24:52 1 0

英特尔内在:向量比较结果与bool conversion的数组

我有几个功能来比较填充布尔值数组的浮点数学向量(每次比较)。 当前,我正在比较它们逐元,但是我想使用SIMD操作来优化它。 但是,问题在于,诸如 _…

人疚 2025-02-10 01:03:02 0 0

PSHUFD SHUFPD有什么区别

我阅读了这两个操作的手册描述,但还不了解差异。有人可以用示例解释ShufPD与PSHUFD的比较吗?…

放手` 2025-02-06 16:25:38 0 0

SSE代码最多查找整数数组

我正在努力优化我的C ++代码以写入SSE指令。 我在我们所在的循环上工作。找到最大向量。 void findMax(vector & index) auto size = index.size(); Ui…

过去的过去 2025-02-06 13:58:28 1 0

由punpcklqdq xmm引起的阀门错误,需要修复mem吗?

punpcklqdq 是 punpcklqdq xmm1,xmm2/m128 __ m128i _mm _unpacklo_epi64(__ M128i A,__m128i b) 描述从下半部的下半部 a和b,并将结果存储在dst…

美人骨 2025-02-06 07:00:52 2 0

英特尔SSE:为什么`_mm_extract_ps`返回in int'而不是float'?

为什么 _mm_extract_ps 返回 int 而不是 float ? 从C中的XMM寄存器读取单个 float 的正确方法是什么? 或更确切地说,询问它的另一种方法是: _MM_SE…

﹎☆浅夏丿初晴 2025-02-06 04:27:29 2 0

自定义ASM脚本中的movdqa segfault

我有以下代码段( https://godbolt.org/z/ce1qe9fvv )幼稚& DOT产品的矢量化版本。 我决定将矢量化版本编译在独立ASM文件中,如下所示: extern…

黯然 2025-02-06 00:29:32 2 0

64位乘以元素的元素,M256I_I64,而长长长长的元素

union sseUnion { int64_t position[4]; btSimdFloat4 mVec256; }; // vector operator * : multiply element by element __m256i mul64_haswell_mul(…

寄与心 2025-02-05 07:09:20 3 0

指令SQRTPD是否同时计算SQRT?

我正在学习SIMD内在和并行计算。我不确定是否 intel x86指令的定义 sqrtpd 说传递给它的两个数字的平方根将同时计算: 在源操作数(第二操作数)中对…

感情洁癖 2025-02-04 10:02:49 2 0

将int32_t转换为未签名的char。 avx

需要使用AVX Intrinsics正确将8 int32_t的YMM和8个未签名的UINT8_T转换为XMM。它应该是 static_cast< uint8_t> 的类似物。这意味着C ++标准规…

递刀给你 2025-02-04 05:36:12 3 0
更多

推荐作者

夢野间

文章 0 评论 0

百度③文鱼

文章 0 评论 0

小草泠泠

文章 0 评论 0

zhuwenyan

文章 0 评论 0

weirdo

文章 0 评论 0

坚持沉默

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文