sse

sse

文章 8 浏览 95

Visual Studio C++ 中的 v4sf 和 __attribute__ 等效项是什么?

typedef float v4sf __attribute__ ((mode(V4SF))); 这是在海湾合作委员会。有人知道等价语法吗? VS 2010将显示__attribute__没有这种类型的存储类,…

音栖息无 2024-12-18 10:30:32 6 0

如何使用 SSE 执行 8 x 8 矩阵运算?

我最初的尝试看起来像这样(假设我们想要乘以) __m128 mat[n]; /* rows */ __m128 vec[n] = {1,1,1,1}; float outvector[n]; for (int row=0;row

来日方长 2024-12-18 09:11:47 3 0

关于XMM寄存器位图的困惑

抱歉,我没有一个好的标题... 我正在阅读此主题: SSE中的向量矩阵乘法 原贴有以下代码 // xmm0 = (v0,v1,v2,v3) movups xmm0, [eax] // xmm0 = (v0,v…

七七 2024-12-18 07:57:15 1 0

SSE 乘法 16 x uint8_t

我想用 SSE4 将 __m128i 对象与 16 个无符号 8 位整数相乘,但我只能找到用于乘法 16 位整数的内在函数。没有诸如_mm_mult_epi8之类的东西吗?…

梦过后 2024-12-16 23:02:32 3 0

如何确定我的程序是否使用 SSE2(通过 gcc 优化)?

我有一个 C++ 程序,它是在 gcc(gcc 版本 4.5.1)下使用 -O3 标志编译的。我正在考虑是否值得制作该程序的 SSE2 版本(或者至少是其中最繁忙的版本)…

鲜血染红嫁衣 2024-12-16 13:24:04 8 0

为什么我的SSE不比C/C快++代码?

我刚刚开始使用 SSE 来优化计算机视觉项目的代码,旨在检测图像中的肤色。下面是我的功能。该函数获取彩色图像并查看每个像素并返回概率图。注释掉的…

も星光 2024-12-15 20:55:15 3 0

使用矩阵算法和常量进行嵌套 for 循环调试。

这组嵌套 for 循环对于 M=64 和 N=64 的值可以正常工作,但当我使 M=128 和 N=64 时不起作用。我有另一个程序来检查矩阵乘法的正确值。直觉上它似乎仍…

梦过后 2024-12-15 03:45:07 4 0

可能的 OpenMP +在 Xcode 4 (LLVM GCC) 中使用 _mm_shuffle_ps 时出现 SSE 错误

我已将编译器从 GCC 切换到 XCode 4.2 中的 LLVM GCC 4.2,并且在 OpenMP 下的 _mm_shuffle_ps 内在函数中遇到了奇怪的链接器错误。这个函数可以在其…

就此别过 2024-12-14 21:38:25 5 0

SSE 从 __m128 中提取整数以索引数组

在一些我已转换为 SSE 的代码中,我执行了一些光线追踪,使用 __m128 数据类型一次追踪 4 条光线。 在确定首先击中哪些对象的方法中,我循环遍历所有…

撕心裂肺的伤痛 2024-12-14 10:04:22 3 0

我的 CPU 中存在 SSE 错误?

我很困惑。 当我在 Visual C++ 2008 中运行此代码时: __m128i a, b; a.m128i_u64[0] = 1; b.m128i_u64[0] = 0; a.m128i_u64[1] = 0; b.m128i_u64[1] …

‖放下 2024-12-14 07:07:51 2 0

用于比较 (_mm_cmpeq_ps) 和赋值操作的 SSE 内在函数

我已经开始使用 SSE 优化我的代码。本质上,它是一个光线追踪器,通过将坐标存储在 __m128 数据类型 x、y、z 中(四条光线的坐标按轴分组),一次处理…

日裸衫吸 2024-12-13 18:10:33 4 0

g++ 4.2 SSE指令的内联汇编用对齐的XMM寄存器副本包装用户汇编代码

我有一个使用内联汇编的函数: vec8w x86_sse_ldvwu(const vec8w* m) { vec8w rd; asm("movdqu %[m],%[rd]" : [rd] "=x" (rd) : [m] "xm" (*m)); retu…

淡淡離愁欲言轉身 2024-12-13 17:25:07 7 0

SSE4a与python中的ctypes? (gcc __builtin_popcount)

这是示例代码 高效在大集合中查找汉明距离低的二进制字符串 static inline int distance(unsigned x, unsigned y) { return __builtin_popcount(x^y);…

笙痞 2024-12-13 09:36:18 6 0

SSE 和 NEON Intrinsics-Shuffling 之间的转换

我正在尝试将以 SSE3 内在函数编写的代码转换为 NEON SIMD,但由于随机播放功能而陷入困境。我查看了 GCC 内在s,ARM 手册和其他论坛但尚未能够找到解…

寻找我们的幸福 2024-12-13 09:34:08 7 0

非常基础的 SSE

我有一个非常简单的程序,我正在尝试提高性能。我知道有帮助的一种方法是利用 SSE3(因为我正在工作的机器支持这一点),但我完全不知道如何做到这一…

遗失的美好 2024-12-13 08:31:37 6 0
更多

推荐作者

夢野间

文章 0 评论 0

百度③文鱼

文章 0 评论 0

小草泠泠

文章 0 评论 0

zhuwenyan

文章 0 评论 0

weirdo

文章 0 评论 0

坚持沉默

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文