sse

sse

文章 8 浏览 91

Java JVM 接受 XX:UseSSE 值吗?

我想比较多个 SSE 版本的应用程序的性能,但无法找到此 JVM 标志接受的值。我正在测试 0、1、3 和 4。我最不确定 4 是否被接受(我见过的所有示例最多…

末が日狂欢 2024-10-29 11:06:16 0 0

如何使用 SSE 指令集对 2 个双精度型或 4 个浮点型进行绝对运算? (最高 SSE4)

这是我尝试使用 SSE 加速的示例 C 代码,两个数组的长度为 3072 个元素,带有双精度数,如果我不需要双精度数的精度,可以将其降低为浮点型。 double …

寄人书 2024-10-29 02:22:21 1 0

使用内部函数时出现未处理的异常

我有一个使用 VC++ 创建的应用程序,想要通过向量化一些操作来探索优化机会。 首先,我正在尝试以下代码: __m128i p1 p1.m128i_u32[0] = 1 p1.m128i_…

樱花坊 2024-10-27 00:39:07 2 0

是否可以在 VC++ 中对乘法进行向量化?没有SSE4?

我想向量化乘法运算。我尝试使用 _mm_mul_epi32,但我的 CPU 仅支持“MMX、SSE (1,2,3,3S)、EM64T”指令。 有人可以告诉我是否可以尝试其他功能吗?…

楠木可依 2024-10-26 19:07:45 2 0

C:尝试将变量存储在特定的 XMM 寄存器中

我正在开发一个涉及 SSE 内在函数和 XMM 寄存器的项目,并且我想使用提供的所有 16 个寄存器。我试图明确告诉编译器执行此操作,但它似乎不起作用。例…

情愿 2024-10-24 19:05:53 2 0

用于克隆扩展 XMM 寄存器的 SSE 指令

是否有任何 SSE 指令(最高版本 4.2)可以自动用另一个 XMM 寄存器的四个字的值填充四个 XMM 寄存器? 示例:在单词 ABCD 上运行指令将填充四个 XMM …

雨落星ぅ辰 2024-10-21 23:38:46 1 0

使用 sse 执行内在函数

我目前正在开始使用 SSE。 我之前关于 SSE 的问题的答案(使用 SSE 将向量乘以常量)让我想到测试使用 _mm_mul_ps() 这样的内部函数和仅使用 * 这样的…

绮烟 2024-10-21 15:53:57 1 0

使用 SSE 将向量乘以常数

我有一些在 4D 向量上运行的代码,目前我正在尝试将其转换为使用 SSE。我在 64b linux 上同时使用 clang 和 gcc。 仅对向量进行操作就可以很好地理解…

-柠檬树下少年和吉他 2024-10-21 10:55:46 3 0

如果在调试器中运行,则数据在 Visual Studio 中无法正确对齐

我与 SSE 合作已经有一段时间了,我也看到了一些一致性问题。然而,这超出了我的理解范围: 无论我是否 使用 F5(调试)运行程序或 我是否在调试器之…

梦冥 2024-10-21 03:31:01 1 0

上交所和中证所容器

以下代码出现段错误是否有明显的原因? #include &ltvector&gt #include &ltemmintrin.h&gt struct point { __m128i v point() { v = _mm_setr_epi32(…

谜兔 2024-10-20 08:44:55 1 0

sse/sse2 双矩阵浮点向量乘法

我必须使用 sse/sse2 实现矩阵向量乘法。 向量和矩阵很大。 矩阵是双精度的,向量是浮点的。 关键是我必须在浮点数上进行的所有计算 - 当我从矩阵获取…

素年丶 2024-10-19 12:45:11 0 0

帮助我改进更多 SSE2 代码

我正在寻求一些帮助来改进 core2 cpu 上的双线性缩放 sse2 代码, 在我的 Atom N270 和 i7 上,此代码比 mmx 代码快大约 2 倍。但在 core2 cpu 下它只…

溺孤伤于心 2024-10-19 10:46:46 3 0

使用 SSE 加速计算 - 存储、加载和对齐

在我的项目中,我实现了基本类 CVector。 此类包含指向原始浮点数组的 float* 指针。 该数组是使用标准 malloc() 函数动态分配的。 现在我必须使用这…

留蓝 2024-10-19 00:10:00 1 0

将常量浮点数加载到 SSE 寄存器中

我正在尝试找出一种将编译时常量浮点数加载到 SSE(2/3) 寄存器中的有效方法。我尝试过编写这样的简单代码, const __m128 x = { 1.0f, 2.0f, 3.0f, 4.…

就是爱搞怪 2024-10-17 22:34:29 2 0

从一个数组中减去另一个数组的最高效方法

我有以下代码,这是我的应用程序的一部分的瓶颈。我所做的就是从另一个数组中减去数组。这两个数组都有大约 100000 个元素。我正在尝试找到一种方法来…

始终不够爱げ你 2024-10-17 19:48:01 3 0
更多

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文