ipad2 neon 浮点速度与 ipad1 对比

发布于 2024-11-16 07:28:27 字数 275 浏览 7 评论 0原文

在 ipad1 和 ipad2 上测试 NEON 指令时,我注意到 ipad2 上的代码几乎没有加速,大多数函数实际上在 ipad2 上运行得比 ipad1 上快得多。

这适用于 VMUL、VLD1、VADD 和 VSUB 等指令,使用 q0 等四字寄存器进行 FFT 等操作。

另外我注意到苹果自己的 FFT 函数 vdsp_fft_zrip 也没有为 ipad2 加速。

那么问题是,对于四字 SIMD 类型指令,ipad2 NEON 是否比 ipad1 NEON 引擎执行速度更快?

When testing NEON instructions on ipad1 and ipad2, I notice allmost no speed up in the code on ipad2, where most functions actually run much faster on ipad2 than on ipad1.

This is for instructions like VMUL, VLD1, VADD and VSUB etc using quad word registers like q0 for things like FFT.

In addition I notice that apples own FFT function vdsp_fft_zrip does not speed up for ipad2 either.

So the question is, does ipad2 NEON execute faster than ipad1 NEON engine for the quad word SIMD type instructions?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

屌丝范 2024-11-23 07:28:27

与核心的其他部分相比,A4 上的 NEON 单元异常强大。 A5 上的其余核心比 A4 有了很大改进,但 NEON 单元的性能或多或少没有变化。您所观察到的情况是预期的。

当然,现在有两个核心,因此如果您可以利用这两个核心,您仍然可以看到显着的加速。此外,A5 上的双精度计算比 A4 有了极大的改进,因为它现在是完全流水线化的。

The NEON unit on the A4 was extraordinarily powerful compared to the rest of the core. The rest of the core on the A5 is much improved from A4, but the NEON unit's performance is more-or-less unchanged. What you are observing is expected.

Of course, there are now two cores, so if you can take advantage of both of them, you can still see significant speedups. Also, double-precision computation on the A5 is vastly improved from the A4, as it is now fully pipelined.

软的没边 2024-11-23 07:28:27

NEON 将在相当长的一段时间内保持不变,即使在最近推出的 64 位 ARM 上也是如此。

NEON 并没有从时钟速度的提高中受益匪浅。 NEON 已经非常快了,它花费了大部分函数执行时间来等待内存中的数据。

NEON will remain the same for quite a while, even on the recently introduced 64bit ARM.

NEON doesn't benefit much from increased clock speed. NEON is already so fast that it spends the majority of the function execution time waiting for the data from memory.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文