intrinsics

intrinsics

文章 0 浏览 6

用于比较 (_mm_cmpeq_ps) 和赋值操作的 SSE 内在函数

我已经开始使用 SSE 优化我的代码。本质上,它是一个光线追踪器,通过将坐标存储在 __m128 数据类型 x、y、z 中(四条光线的坐标按轴分组),一次处理…

日裸衫吸 2024-12-13 18:10:33 4 0

SSE 和 NEON Intrinsics-Shuffling 之间的转换

我正在尝试将以 SSE3 内在函数编写的代码转换为 NEON SIMD,但由于随机播放功能而陷入困境。我查看了 GCC 内在s,ARM 手册和其他论坛但尚未能够找到解…

寻找我们的幸福 2024-12-13 09:34:08 7 0

将内部 xmm 寄存器转换为 uint8_t 数组[16]

如何有效地将 xmm 寄存器转储到 uint8_t 数组 [16] 中?…

一城柳絮吹成雪 2024-12-08 02:26:30 4 0

将内联 ASM 转换为 Intrinsic

我接到一项任务,将一小段汇编代码转换为内在函数,以测试性能。 我从未为其中任何一个开发过任何代码,但我了解 asm 和 c,并阅读了内在语法。但我找…

深海夜未眠 2024-12-07 21:50:26 5 0

使用内在函数的 SSE2 汇编溢出

我是 SSE 和 SSE2 的新手,我编写了一个小型 C 示例(分配两个计数器,一个计数器增加,另一个计数器减少,而不是将两个计数器相加),它按预期工作。…

廻憶裏菂餘溫 2024-11-29 01:56:48 6 0

在 C# 中使用 pragma inside(sqrt, pow)?

C++ 摘要 在代码的预处理器部分使用#pragma inside 命令将大大提高大多数数学函数调用的速度。 #pragma intrinsic(sqrt, pow) 上面的代码允许大多数数…

谁对谁错谁最难过 2024-11-18 08:44:29 5 0

SSE 在哪里可以找到从 SSE 内在函数到汇编程序的翻译指南

我需要在 SSE2 汇编器中编写一些东西。 我所看到的都是内在的。 我一直在徒劳地寻找从内在函数到汇编程序的转换表。 因为我不想玩猜谜游戏,有人可以…

花伊自在美 2024-11-16 21:11:33 8 0

_mm_cmpistrm SSE4.2 内在模式

我试图弄清楚如何为 _mm_cmpistrm SSE4.2 内在函数设置“模式”标志。我有一个常规 C 字符串 (char*),正在使用 _mm_lddqu_si128 将其加载到 __m128i …

我还不会笑 2024-11-15 11:35:54 7 0

SSE 内在函数中的 if/else 语句

我正在尝试使用 SSE 内在函数优化一小段代码(我是该主题的初学者),但我对条件的使用有点困惑。 我原来的代码是: unsigned long c; unsigned long …

计㈡愣 2024-11-14 15:22:04 11 0

具有 SSE4.1 内在函数的双线性滤波器

我现在正在尝试找出一种一次仅针对一个过滤样本的相当快速的双线性过滤函数,作为习惯使用内在函数的练习 - 最高可达 SSE41 就可以了。 到目前为止,…

热风软妹 2024-11-06 23:58:51 9 0

SSE2值提取问题

我想从128位寄存器中提取值(第一个字16位),我得到了这个命令,但这不起作用。设置a的值后会有一些算术运算,然后变量内部会有一些算术运算结果最终…

金兰素衣 2024-11-06 19:24:52 7 0

删除 Visual C 中的 SSE2 内在函数

有谁知道如何从源代码中删除所有 SSE2 内在函数(在 Visual C++ 中)?可能有些地方有一些,因为我一直在使用SSE2。现在我想再次将我的项目转移到SSE…

情绪失控 2024-11-04 22:19:28 6 0

对于不属于标准一部分的 FORTRAN 内在函数,我该怎么办?

我正在尝试通过使用 gfortran 从源代码构建旧版 FORTRAN 代码来工作。我终于能够成功构建它,但现在运行时出现越界错误。我使用 gdb 并将错误跟踪到使…

花海 2024-11-04 21:17:32 9 0

编译器如何处理 SSE(或任何)内部函数?

不久前,我在某处读到 SSE 内部函数可以编译成高效的机器代码,因为编译器对待它们的方式与普通函数不同。我想知道编译器实际上是如何做到这一点的,…

甜中书 2024-11-01 08:55:32 7 0

WinAPI _Interlocked* char、short 的内部函数

我需要在 char 或 Short 上使用 _Interlocked*** 函数,但它需要长指针作为输入。似乎有函数 _InterlockedExchange8,我没有看到任何相关文档。看起来…

你对谁都笑 2024-10-18 15:30:45 8 0
更多

推荐作者

夢野间

文章 0 评论 0

百度③文鱼

文章 0 评论 0

小草泠泠

文章 0 评论 0

zhuwenyan

文章 0 评论 0

weirdo

文章 0 评论 0

坚持沉默

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文