intrinsics

intrinsics

文章 0 浏览 6

快速格式转换开源库

Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …

Spring初心 2024-09-05 03:26:20 12 0

为什么我的数据似乎没有对齐?

我试图弄清楚如何最好地预先计​​算一些正弦和余弦值,将它们存储在对齐的块中,然后稍后将它们用于 SSE 计算: 在程序开始时,我创建一个带有成员的…

遗弃M 2024-09-04 10:14:17 9 0

x86-64 处理器的数据类型

这些数据类型有什么用? __m64,__m128, __m256?…

所谓喜欢 2024-09-04 09:38:04 10 0

帮助进行汇编/SSE 乘法

我一直在试图弄清楚如何在非常关键的几行代码中获得一些改进: float x = a*b; float y = c*d; float z = e*f; float w = g*h; 所有 a、b、c... 都是…

鹿港小镇 2024-09-04 07:57:13 13 0

g++上证所内在困境——内在“饱和”带来的价值

我编写了一个简单的程序来实现 SSE 内在函数,用于计算两个大型(100000 个或更多元素)向量的内积。该程序比较了传统方法和使用内在函数计算内积的执…

长不大的小祸害 2024-09-04 02:14:58 14 0

有 ARM Neon 内在函数的好参考吗?

ARM 参考手册并未对各个指令进行过多详细介绍 ( http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0348b/BABIIBBG.html )。有没有更…

所有深爱都是秘密 2024-09-01 12:18:51 16 0

逻辑 SSE 内在函数之间有什么区别?

不同类型的逻辑 SSE 内在函数之间有什么区别吗?例如,如果我们进行 OR 运算,则存在三个内在函数:_mm_or_ps、_mm_or_pd 和 _mm_or_si128 所有这些都…

滿滿的愛 2024-08-31 20:03:04 19 0

通过引用内联函数传递 __m128i 对象是否会导致这些对象移动到堆栈?

我正在使用 SSE2 内在函数编写 8x16 位向量的转置函数。由于该函数有 8 个参数(8x8x16 位大小的矩阵),因此除了通过引用传递它们之外我无能为力。编…

黄昏下泛黄的笔记 2024-08-30 16:20:55 10 0

英特尔 AVX 内在函数:有兼容库吗?

有 Intel AVX 内在函数库吗?我正在寻找类似于“sse2mmx.h”标头的内容,如果 SSE2 整数内在函数在编译时不可用,则该标头会回退到 MMX 内在函数。因…

稚然 2024-08-30 01:12:34 14 0

_mm_mwait 如何工作?

pmmintrin.h 中的 _mm_mwait 如何工作? (我的意思不是它的汇编,而是操作以及如何在 NUMA 系统中执行此操作。store 监控仅在基于总线的 SMP 系统上…

幸福不弃 2024-08-27 02:31:18 16 0

Linux/gcc 中 InterlockedIncrement 的等效项

这将是一个非常简单的问题(可以重复),但我无法找到它。 Win32 API 提供了一组非常方便的原子操作(作为内在函数),例如发出 lock add x86 代码的 …

兮颜 2024-08-19 11:18:41 12 0

VC++ SSE 内在优化怪异

我正在从文件中执行 8 位数据的分散读取(解交错 64 通道波形文件)。然后我将它们组合成一个字节流。我遇到的问题是重新构建要写出的数据。 基本上,…

兲鉂ぱ嘚淚 2024-08-17 12:19:47 11 0

如何在 VS2008 64 位版本中用 intristic 替换 __asm jno no_oflow?

我有这段代码: __asm jno no_oflow overflow = 1; __asm no_oflow: 它产生了这个很好的警告: 错误 C4235:使用了非标准扩展:此架构不支持“__asm”…

寻找我们的幸福 2024-08-14 08:28:22 14 0

C# 快速 crc32 计算:

我已经用 Ants 分析了我的应用程序,发现 > 10% 用于 CRC32 计算。 (CRC32 计算是用纯 C# 完成的) 我做了一些谷歌搜索并了解了 Visual Studio 2008 …

倾城泪 2024-08-13 22:33:53 17 0

如何快速找到向量和的最大元素?

我的程序的最内部循环中有以下代码, struct V { float val [200]; // 0 <= val[i] <= 1 }; V a[600]; V b[250]; V c[250]; V d[350]; V e[350]; // .…

沉鱼一梦 2024-08-03 23:32:04 9 0
更多

推荐作者

夢野间

文章 0 评论 0

百度③文鱼

文章 0 评论 0

小草泠泠

文章 0 评论 0

zhuwenyan

文章 0 评论 0

weirdo

文章 0 评论 0

坚持沉默

文章 0 评论 0

更多

友情链接

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文