第 5 页 - sse - 文江博客

投稿关注

sse

文章 8 浏览 95

Visual Studio C++ 中的 v4sf 和 attribute 等效项是什么？

typedef float v4sf __attribute__ ((mode(V4SF))); 这是在海湾合作委员会。有人知道等价语法吗？ VS 2010将显示__attribute__没有这种类型的存储类，…

音栖息无 2024-12-18 10:30:32 6 0

如何使用 SSE 执行 8 x 8 矩阵运算？

我最初的尝试看起来像这样（假设我们想要乘以） __m128 mat[n]; /* rows */ __m128 vec[n] = {1,1,1,1}; float outvector[n]; for (int row=0;row

来日方长 2024-12-18 09:11:47 3 0

关于XMM寄存器位图的困惑

抱歉，我没有一个好的标题... 我正在阅读此主题： SSE中的向量矩阵乘法原贴有以下代码 // xmm0 = (v0,v1,v2,v3) movups xmm0, [eax] // xmm0 = (v0,v…

七七 2024-12-18 07:57:15 1 0

SSE 乘法 16 x uint8_t

我想用 SSE4 将 __m128i 对象与 16 个无符号 8 位整数相乘，但我只能找到用于乘法 16 位整数的内在函数。没有诸如_mm_mult_epi8之类的东西吗？…

梦过后 2024-12-16 23:02:32 3 0

如何确定我的程序是否使用 SSE2（通过 gcc 优化）？

我有一个 C++ 程序，它是在 gcc（gcc 版本 4.5.1）下使用 -O3 标志编译的。我正在考虑是否值得制作该程序的 SSE2 版本（或者至少是其中最繁忙的版本）…

鲜血染红嫁衣 2024-12-16 13:24:04 8 0

为什么我的SSE不比C/C快++代码？

我刚刚开始使用 SSE 来优化计算机视觉项目的代码，旨在检测图像中的肤色。下面是我的功能。该函数获取彩色图像并查看每个像素并返回概率图。注释掉的…

も星光 2024-12-15 20:55:15 3 0

使用矩阵算法和常量进行嵌套 for 循环调试。

这组嵌套 for 循环对于 M=64 和 N=64 的值可以正常工作，但当我使 M=128 和 N=64 时不起作用。我有另一个程序来检查矩阵乘法的正确值。直觉上它似乎仍…

梦过后 2024-12-15 03:45:07 4 0

可能的 OpenMP +在 Xcode 4 (LLVM GCC) 中使用 _mm_shuffle_ps 时出现 SSE 错误

我已将编译器从 GCC 切换到 XCode 4.2 中的 LLVM GCC 4.2，并且在 OpenMP 下的 _mm_shuffle_ps 内在函数中遇到了奇怪的链接器错误。这个函数可以在其…

就此别过 2024-12-14 21:38:25 5 0

SSE 从 __m128 中提取整数以索引数组

在一些我已转换为 SSE 的代码中，我执行了一些光线追踪，使用 __m128 数据类型一次追踪 4 条光线。在确定首先击中哪些对象的方法中，我循环遍历所有…

撕心裂肺的伤痛 2024-12-14 10:04:22 3 0

我的 CPU 中存在 SSE 错误？

我很困惑。当我在 Visual C++ 2008 中运行此代码时： __m128i a, b; a.m128i_u64[0] = 1; b.m128i_u64[0] = 0; a.m128i_u64[1] = 0; b.m128i_u64[1] …

‖放下 2024-12-14 07:07:51 2 0

用于比较 (_mm_cmpeq_ps) 和赋值操作的 SSE 内在函数

我已经开始使用 SSE 优化我的代码。本质上，它是一个光线追踪器，通过将坐标存储在 __m128 数据类型 x、y、z 中（四条光线的坐标按轴分组），一次处理…

日裸衫吸 2024-12-13 18:10:33 4 0

g++ 4.2 SSE指令的内联汇编用对齐的XMM寄存器副本包装用户汇编代码

我有一个使用内联汇编的函数： vec8w x86_sse_ldvwu(const vec8w* m) { vec8w rd; asm("movdqu %[m],%[rd]" : [rd] "=x" (rd) : [m] "xm" (*m)); retu…

淡淡離愁欲言轉身 2024-12-13 17:25:07 7 0

SSE4a与python中的ctypes？ (gcc __builtin_popcount)

这是示例代码高效在大集合中查找汉明距离低的二进制字符串 static inline int distance(unsigned x, unsigned y) { return __builtin_popcount(x^y);…

笙痞 2024-12-13 09:36:18 6 0

SSE 和 NEON Intrinsics-Shuffling 之间的转换

我正在尝试将以 SSE3 内在函数编写的代码转换为 NEON SIMD，但由于随机播放功能而陷入困境。我查看了 GCC 内在s，ARM 手册和其他论坛但尚未能够找到解…

寻找我们的幸福 2024-12-13 09:34:08 7 0

非常基础的 SSE

我有一个非常简单的程序，我正在尝试提高性能。我知道有帮助的一种方法是利用 SSE3（因为我正在工作的机器支持这一点），但我完全不知道如何做到这一…

遗失的美好 2024-12-13 08:31:37 6 0

共 17 页
上一页
3
4
5
6
7
下一页

关注

友情链接

文江博客

sse

Visual Studio C++ 中的 v4sf 和 attribute 等效项是什么？

如何使用 SSE 执行 8 x 8 矩阵运算？

关于XMM寄存器位图的困惑

SSE 乘法 16 x uint8_t

如何确定我的程序是否使用 SSE2（通过 gcc 优化）？

为什么我的SSE不比C/C快++代码？

使用矩阵算法和常量进行嵌套 for 循环调试。

可能的 OpenMP +在 Xcode 4 (LLVM GCC) 中使用 _mm_shuffle_ps 时出现 SSE 错误

SSE 从 __m128 中提取整数以索引数组

我的 CPU 中存在 SSE 错误？

用于比较 (_mm_cmpeq_ps) 和赋值操作的 SSE 内在函数

g++ 4.2 SSE指令的内联汇编用对齐的XMM寄存器副本包装用户汇编代码

SSE4a与python中的ctypes？ (gcc __builtin_popcount)

SSE 和 NEON Intrinsics-Shuffling 之间的转换

非常基础的 SSE

热门标签

推荐作者

夢野间

百度③文鱼

小草泠泠

zhuwenyan

weirdo

坚持沉默

友情链接