neon

neon

文章 0 浏览 2

NEON ASM 代码运行速度比 C 代码慢很多?

我正在尝试使用 NEON 在 iPhone ARM 上针对特定问题实现高斯牛顿优化。下面的第一个函数是我原来的 C 函数。第二个是我写的NEON asm代码。我每个都运…

2024-11-07 15:52:37 1 0

为什么 ARM NEON 不比普通 C++ 更快?

这是一个 C++ 代码: #define ARR_SIZE_TEST ( 8 * 1024 * 1024 ) void cpp_tst_add( unsigned* x, unsigned* y ) { for ( register int i = 0 i &lt …

又爬满兰若 2024-11-02 14:47:50 1 0

使用内在函数进行 Neon 优化

在了解 ARM NEON 内在函数之后,我对自己编写的一个函数进行了计时,该函数将数组中的元素加倍。使用该内在函数的版本比该函数的普通 C 版本需要更多…

独孤求败 2024-11-02 06:57:26 1 0

PLD 对 A9 皮质没有影响

我正在使用以下程序来检查 PLD 对性能的影响。但是,我无法发现我编写的 C 代码使用和不使用 PLD 时的性能差异。我是否缺少任何内容或需要添加任何编…

雨的味道风的声音 2024-10-21 19:44:11 3 0

Android 上的 ffmpeg neon 编译 - 汇编程序错误

我正在尝试为带有 neon 支持的 android 编译 ffmpeg,但出现以下汇编程序错误。如果有人对此有任何线索,请告诉我? /home/user1/android-ndk-r5b/too…

家住魔仙堡 2024-10-20 12:08:24 0 0

没有 neon 支持的 Android 上 ffmpeg 解码的性能

我已经在 android 上编译了 ffmpeg 代码,并且能够在没有 neon 支持和 armv5te 的情况下播放视频。解码很好,视频可以播放,但问题是帧速率真的很糟糕…

栀梦 2024-10-20 03:29:05 2 0

NEON:如何将 128 位 ARGB 转换为具有饱和度的 32 位 ARGB?

我有一个 ARGB 像素存储在 128 位 NEON 寄存器中,每个通道 32 位。我需要将其作为 8 位通道 ARGB(缩小和饱和)存储到内存中。 我在 vmla.32 q1, q2,…

り繁华旳梦境 2024-10-16 12:28:38 4 0

ARM Cortex-A8:一次内存读取读取了多少字节?

我正在尝试改进在 ARM cortex-a8 处理器上运行的图像处理项目。 我正在从内存中访问 8 位灰度图像数据。在我的函数中,现在我正在逐字节访问单个像素…

孤凫 2024-10-04 17:06:11 4 0

vreinterpret NEON 内在问题

好吧,最后一天我一直在摸头,我确信这很简单,所以就开始吧。为什么这段代码不起作用?我正在使用 Xcode 3.2.5 和 LLVM,当我尝试编译这样的东西时:…

如痴如狂 2024-10-03 19:16:48 10 0

ARM Cortex-A8:如何同时使用 NEON 和 vfpv3

我正在使用 Cortex-A8 处理器,但我不明白如何使用 -mfpu 标志。 Cortex-A8 上有 vfpv3 和 neon 协处理器。以前我不知道如何使用 neon,所以我只使用 …

内心荒芜 2024-10-03 02:45:18 5 0

如何在发送请求体之前检查是否可以执行PUT?

注意:我们在客户端使用 lib_neon,在服务器端使用 Tomcat 和 servlet api。 问题如下:当客户端想要放置一些内容时,它执行带有“Expect:100-Contin…

猥琐帝 2024-10-01 04:08:38 4 0

ARM Cortex-A8:VFP 和 NEON 有什么区别

在ARM Cortex-A8处理器中,我了解NEON是什么,它是一个SIMD协处理器。 但同时也是协处理器的VFP(矢量浮点)单元是否可以用作SIMD处理器呢?如果可以…

云裳 2024-09-30 18:28:04 5 0

为 ARM NEON 进行编译时出现未知的 GCC 错误(严重)

我有一个基于 ARM NEON Cortex-A8 的处理器目标。我正在通过使用 NEON 来优化我的代码。但是当我编译代码时,我收到这个奇怪的错误。不知道如何解决这…

木緿 2024-09-25 20:15:27 6 0

如何在 iPad A4 处理器上执行整数 SIMD 运算?

我觉得需要速度。双 for 循环正在降低我的 iPad 应用程序的性能。我需要SIMD。如何在 iPad A4 处理器上执行整数 SIMD 运算? 谢谢, 道格…

唯憾梦倾城 2024-09-25 12:34:31 4 0

ARM NEON:vld4_f32 和 vld4q_f32 有什么区别?

我无法区分 ARM NEON 指令中的 vld4_f32 和 vld4q_f32 之间的区别。 当我提高编码水平并开始查看汇编指令而不是信息较少的内在函数时,混乱就开始了。…

于我来说 2024-09-25 01:29:06 5 0
更多

推荐作者

1CH1MKgiKxn9p

文章 0 评论 0

ゞ记忆︶ㄣ

文章 0 评论 0

JackDx

文章 0 评论 0

信远

文章 0 评论 0

yaoduoduo1995

文章 0 评论 0

霞映澄塘

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文