如何在 iPad A4 处理器上执行整数 SIMD 运算?
我觉得需要速度。双 for 循环正在降低我的 iPad 应用程序的性能。我需要SIMD。如何在 iPad A4 处理器上执行整数 SIMD 运算?
谢谢,
道格
I feel the need for speed. Double for loops are killing my iPad apps performance. I need SIMD. How do I perform integer SIMD operations on the iPad A4 processor?
Thanks,
Doug
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
指令集是NEON,内在参考
我从来没有能够找到关于它们实际上是什么的良好文档。但如果您接触过 SSE,您很快就会掌握它
The instruction set is NEON, intrinsics reference
I've never been able to find good documentation on what they all actually are. But you pick it up pretty quickly if you've had any exposure to SSE
为了获得最快的速度,您必须编写使用 NEON SIMD 操作的 ARM 汇编语言代码,因为 C 编译器通常不会生成非常好的 SIMD 代码,因此手写的汇编将产生很大的差异。我在这里有一个简短的介绍:http://www.shervinemami.co.cc/iphoneAssembly.html< /a>
请注意,iPad A4 使用 ARMv7-A CPU,因此 NEON SIMD 指令的参考手册位于:http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html
(但它有 2000 页长,需要了解汇编代码,也许还需要了解 SIMD!)。
To get the fastest speed, you will have to write ARM Assembly language code that uses NEON SIMD operations, because the C compilers generally don't make very good SIMD code, so hand-written Assembly will make a big difference. I have a brief intro here: http://www.shervinemami.co.cc/iphoneAssembly.html
Note that the iPad A4 uses the ARMv7-A CPU, so the reference manual for the NEON SIMD instructions is at: http://infocenter.arm.com/help/topic/com.arm.doc.ddi0406b/index.html
(but its 2000 pages long and requires the understanding of Assembly code and perhaps SIMD in general!).