sse

sse

文章 8 浏览 95

数学“pow”的 SSE 向量化函数海湾合作委员会

我试图对包含数学库中“pow”函数的使用的循环进行矢量化。我知道英特尔编译器支持对 sse 指令使用“pow” - 但我似乎无法让它与 gcc 一起运行(我认…

忆梦 2024-11-27 20:13:15 8 0

如何从 SSE 获得最大速度?

MXCSR 等内容的最佳设置是什么?哪种舍入模式最快?在什么处理器上?启用 NaN 信号是否更快,以便我在计算结果为 nan 时收到通知,或者这是否会导致非…

夜光 2024-11-27 11:19:54 8 0

如何使用 SIMD 比较两个向量并获得单个布尔结果?

我有两个分别包含 4 个整数的向量,我想使用 SIMD 命令来比较它们(假设根据比较结果生成一个结果向量,其中每个条目为 0 或 1)。 然后,我想将结果…

迎风吟唱 2024-11-27 08:53:45 4 0

如何在 Visual Studio 2010 中添加 SIMD 相关编译器标志

我找到了这个标志列表: http://www.ncsa.illinois.edu/UserInfo/Resources/Software/Intel/Compilers/10.0/main_for/mergedProjects/optaps_for/comm…

疾风者 2024-11-26 23:26:04 8 0

有效地将大复数向量乘以标量 C++

我目前正在尝试最有效地对复数数组(内存对齐方式与 std::complex 相同,但当前使用我们自己的 ADT)与相同的标量值数组进行就地乘法size 作为复数数…

仙女 2024-11-26 17:56:16 5 0

使用 MMX 汇编指令的乘法加左移操作

我正在寻找进行 shl(mult(var1,var2),1) 操作,其中 mult 乘以 var1 和 var2(均为 16 位有符号整数)和 shl 对乘法结果进行算术左移。如果发生上溢或…

英雄似剑 2024-11-26 13:32:12 6 0

通过翻译复制内存的快速方法 - ARGB 到 BGR

概述 我有一个图像缓冲区,需要将其转换为另一种格式。原始图像缓冲区有四个通道,每个通道 8 位,Alpha、Red、Green 和 Blue。目标缓冲区是三个通道…

鹿港巷口少年归 2024-11-26 13:05:53 12 0

使用 OpenMp 和 SSE 的分段错误

我刚刚开始尝试将 OpenMP 添加到一些 SSE 代码中。 我的第一个测试程序有时会在 _mm_set_ps 中崩溃,但当我设置 if (0) 时可以正常工作。 它看起来很…

大姐,你呐 2024-11-24 12:25:12 5 0

以 [this] 作为目标的 movss 指令的目的是什么?

我在 Visual Studio 2008 的 MSVC 编译器生成的代码中发现了这一行,同时试图找出似乎是编译器错误的内容: movss dword ptr [this], xmm2 虽然我不认…

蔚蓝源自深海 2024-11-23 19:25:39 3 0

MOVDQA 和 MOVAPS x86 指令之间的区别?

我正在查找英特尔数据表:英特尔® 64 和 IA-32 架构 软件开发人员手册,我找不到 MOVDQA:移动对齐双四字 MOVAPS:移动对齐打包单精度 之间的区别在英…

节枝 2024-11-19 20:04:12 14 0

如何让 ICC 编译器在内循环中生成 SSE 指令?

我有一个像这样的内部循环 for(i=0 ;i

要走干脆点 2024-11-18 21:46:13 7 0

SIMD 常量浮点数

我一直在尝试使用微软的 sse 内在函数来优化一些代码。优化代码时最大的问题之一是每当我想使用常量时就会发生 LHS。似乎有一些关于生成某些常量的信…

白日梦 2024-11-18 10:33:45 7 0

SSE2 双倍乘法比标准乘法慢

我想知道为什么以下带有 SSE2 指令的代码执行乘法的速度比标准 C++ 实现慢。 代码如下: m_win = (double*)_aligned_malloc(size*sizeof(double), 16)…

极度宠爱 2024-11-18 04:41:15 9 0

结合使用内联数学库和预编译头文件时出现链接错误

我今天遇到了一个相当奇怪的问题。我有一个针对 SSE 优化的数学库,因此几乎所有功能都被声明为内联。为了简化起见,我将仅使用一个类 Vector3 来解释…

[旋木] 2024-11-17 05:49:47 6 0

SSE 在哪里可以找到从 SSE 内在函数到汇编程序的翻译指南

我需要在 SSE2 汇编器中编写一些东西。 我所看到的都是内在的。 我一直在徒劳地寻找从内在函数到汇编程序的转换表。 因为我不想玩猜谜游戏,有人可以…

花伊自在美 2024-11-16 21:11:33 8 0
更多

推荐作者

梦断已成空

文章 0 评论 0

瞎闹

文章 0 评论 0

寄意

文章 0 评论 0

似梦非梦

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文