常见的 SIMD 技术

发布于 2024-08-20 00:16:16 字数 353 浏览 6 评论 0原文

在哪里可以找到有关常见 SIMD 技巧的信息?我有一个指令集,并且知道如何编写不复杂的 SIMD 代码,但我知道,SIMD 现在更加强大。它可以容纳复杂的条件无分支代码。
例如(ARMv6),以下指令序列将 Rd 的每个字节设置为 Ra 和 Rb 相应字节的无符号最小值:

USUB8 Rd, Ra, Rb
SEL Rd, Rb, Ra

教程/不常见 SIMD 技术的链接也很好:) < strong>ARMv6 对我来说是最有趣的,但是 x86(SSE,...)/Neon(在 ARMv7 中)/其他也不错。

Where can I find information about common SIMD tricks? I have an instruction set and know, how to write non-tricky SIMD code, but I know, SIMD now is much more powerful. It can hold complex conditional branchless code.
For example (ARMv6), the following sequence of instructions sets each byte of Rd equal to the unsigned minimum of the corresponding bytes of Ra and Rb:

USUB8 Rd, Ra, Rb
SEL Rd, Rb, Ra

Links to tutorials / uncommon SIMD techniques are good too :) ARMv6 is the most interesting for me, but x86(SSE,...)/Neon(in ARMv7)/others are good too.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

淡紫姑娘! 2024-08-27 00:16:16

最好的 SIMD 资源之一是旧的 AltiVec 邮件列表。尽管特定于 PowerPC/AltiVec,但我怀疑使用其他 SIMD 架构的任何人都会对该列表中的许多材料感兴趣。遗憾的是,该列表在移至 power.org 上的论坛后似乎已失效,但您也许可以找到它的存档版本。 (如果没有,请告诉我 - 我几乎拥有 2000 年至 2007 年的所有帖子。)

还有很多有关 AltiVec、SSE、SIMD 矢量化和性能的潜在有用信息,请访问 developer.apple.com/hardwaredrivers/ve,其中很大一部分可以转移到其他 SIMD 架构。

One of the best SIMD resources ever was the old AltiVec mailing list. Although PowerPC/AltiVec-specific I suspect that a lot of the material on this list would be of general interest to anyone working with other SIMD architectures. Sadly this list seems now to be defunct after being moved to a forum on power.org, but you may be able to find archived versions of it. (If not then let me know - I have pretty much all the posts from 2000 - 2007.)

There is also a lot of potentially useful info on AltiVec, SSE, SIMD vectorization and performance in general at developer.apple.com/hardwaredrivers/ve, a good deal of which may be transferable to other SIMD architectures.

仅此而已 2024-08-27 00:16:16

在 sourceforge 上尝试 AMD 的 SSEPlus 项目

Try AMD's SSEPlus project on sourceforge

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文