sse

sse

文章 8 浏览 91

尽快比较缓冲区

我需要逐块比较两个缓冲区的相等性。我不需要有关两个缓冲区关系的信息,只要每两个块是否相等即可。我的 intel 机器最高支持 SSE4.2 天真的方法是: …

别再吹冷风 2024-11-09 23:44:43 0 0

您将如何编写可能优化为一条 SSE 指令的无符号加法代码?

在 C 或 C++ 中,如何编写可能通过 GCC 优化的两个数组的无符号加法代码,将其优化为一个 128 位 SSE 无符号加法指令?…

一刻暧昧 2024-11-09 18:43:20 0 0

如何检查CPU是否支持SSE3指令集?

以下代码是否有效用于检查 CPU 是否支持 SSE3 指令集? 使用 IsProcessorFeaturePresent( ) 功能显然在 Windows XP 上不起作用。 bool CheckSSE3() { …

枯寂 2024-11-09 11:12:48 0 0

追踪哪个依赖项包含 SSE 指令

我们的一位客户需要在没有 SSE 的情况下构建我们的程序,因为他使用的是相当旧的硬件。我的问题是,即使我全面修改我们的项目设置以取消所有库和应用…

呆橘 2024-11-07 19:58:55 1 0

openMP 和 SSE,我的程序没有加速

这是我的并行运行代码的一部分: timer.Start() for(int i = 0 i &lt params.epochs ++i) { #pragma omp for for(int j = 0 j &lt min_net ++j) { std…

鹿港小镇 2024-11-07 04:51:47 1 0

具有 SSE4.1 内在函数的双线性滤波器

我现在正在尝试找出一种一次仅针对一个过滤样本的相当快速的双线性过滤函数,作为习惯使用内在函数的练习 - 最高可达 SSE41 就可以了。 到目前为止,…

热风软妹 2024-11-06 23:58:51 0 0

如何强制 gcc 使用所有 SSE(或 AVX)寄存器?

我正在尝试使用 SSE 或新的 AVX 指令为 Windows x64 目标编写一些计算密集型代码,在 GCC 4.5.2 和 4.6.1、MinGW64(TDM GCC 构建和一些自定义构建)…

蓝颜夕 2024-11-06 22:51:59 1 0

SSE2值提取问题

我想从128位寄存器中提取值(第一个字16位),我得到了这个命令,但这不起作用。设置a的值后会有一些算术运算,然后变量内部会有一些算术运算结果最终…

金兰素衣 2024-11-06 19:24:52 0 0

SSE 与串行浮点加法不匹配

这是让我悲伤的测试程序: #include &ltxmmintrin.h&gt #include &ltstdio.h&gt inline float _mm_hadd_ps(const __m128 v) { const __m128 x = _mm_a…

在你怀里撒娇 2024-11-04 16:45:29 1 0

GCC 内联汇编 - 在调用之前将浮点移动到 XMM0

我目前正在尝试从 GCC 内联汇编调用通用 C 函数(我知道这是个坏主意,但我今天很无聊......)。 我的操作系统是 Mac OS X,64 位,因此调用约定是 Sy…

極樂鬼 2024-11-04 14:21:51 1 0

优化可变长度编码

我有一个例子,我需要压缩很多通常很小的值。因此,我使用可变长度字节编码来压缩它们(ULEB128,具体来说): size_t compress_unsigned_int(unsigne…

月下伊人醉 2024-11-04 09:13:16 0 0

分析 SIMD 代码

已更新 - 检查下面 将使其尽可能简短。如果需要,很乐意添加更多详细信息。 我有一些用于标准化向量的 sse 代码。我正在使用 QueryPerformanceCounter…

只为守护你 2024-11-03 17:30:41 1 0

32 位应用程序中的 64 位功能?

我有一个 32 位应用程序,计划在 64 位 Windows 7 上运行。 现阶段,由于依赖第三方功能,我无法将整个应用程序转换为 64 位。 但是,我希望能够在 SS…

终难遇 2024-11-03 07:13:56 1 0

有没有好的 x86 双精度小矩阵 SIMD 库?

我正在寻找一个专注于图形小型 (4x4) 矩阵运算的 SIMD 库。那里有很多单精度,但我需要支持单精度和双精度。 我看过 Intel 的 IPP MX 库,但我更喜欢…

萌面超妹 2024-11-02 18:34:09 1 0

编译器如何处理 SSE(或任何)内部函数?

不久前,我在某处读到 SSE 内部函数可以编译成高效的机器代码,因为编译器对待它们的方式与普通函数不同。我想知道编译器实际上是如何做到这一点的,…

甜中书 2024-11-01 08:55:32 1 0
更多

推荐作者

烙印

文章 0 评论 0

singlesman

文章 0 评论 0

独孤求败

文章 0 评论 0

晨钟暮鼓

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文