如何在 iPad A4 处理器上执行整数 SIMD 运算?

发布于 2024-09-25 12:34:31 字数 99 浏览 4 评论 0原文

我觉得需要速度。双 for 循环正在降低我的 iPad 应用程序的性能。我需要SIMD。如何在 iPad A4 处理器上执行整数 SIMD 运算?

谢谢,
道格

I feel the need for speed. Double for loops are killing my iPad apps performance. I need SIMD. How do I perform integer SIMD operations on the iPad A4 processor?

Thanks,
Doug

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

早茶月光 2024-10-02 12:34:31

指令集是NEON,内在参考

我从来没有能够找到关于它们实际上是什么的良好文档。但如果您接触过 SSE,您很快就会掌握它

The instruction set is NEON, intrinsics reference

I've never been able to find good documentation on what they all actually are. But you pick it up pretty quickly if you've had any exposure to SSE

表情可笑 2024-10-02 12:34:31

为了获得最快的速度,您必须编写使用 NEON SIMD 操作的 ARM 汇编语言代码,因为 C 编译器通常不会生成非常好的 SIMD 代码,因此手写的汇编将产生很大的差异。我在这里有一个简短的介绍:http://www.shervinemami.co.cc/iphoneAssembly.html< /a>

请注意,iPad A4 使用 ARMv7-A CPU,因此 NEON SIMD 指令的参考手册位于:http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html
(但它有 2000 页长,需要了解汇编代码,也许还需要了解 SIMD!)。

To get the fastest speed, you will have to write ARM Assembly language code that uses NEON SIMD operations, because the C compilers generally don't make very good SIMD code, so hand-written Assembly will make a big difference. I have a brief intro here: http://www.shervinemami.co.cc/iphoneAssembly.html

Note that the iPad A4 uses the ARMv7-A CPU, so the reference manual for the NEON SIMD instructions is at: http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html
(but its 2000 pages long and requires the understanding of Assembly code and perhaps SIMD in general!).

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文