当前位置：文江博客话题详情

使用 opencv 框架的 Objective C 项目的最佳编译器标志

发布于 2024-12-22 14:52:07 字数 326 浏览 1 评论 0原文

我正在使用 opencv 框架编译 ios 项目，所以我有兴趣知道什么是我的项目的最佳编译器标志。

该项目处理大量矩阵像素，因此我需要从编译器方面获得 SIMD 指令，以便能够尽可能高效地处理该矩阵。

我使用这个标志：-mfpu=neon、-mfloat-abi=softfp 和 -O3，

我还找到了其他标志： -mno-拇指 -mfpu=特立独行 -ftree-向量化 -DNS_BLOCK_ASSERTIONS=1

我真的不知道它是否会节省我大量的CPU处理时间，我通过谷歌进行搜索，但我没有找到一些东西可以让我有充分的理由知道最好的编译器标志。

谢谢

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

段念尘 2024-12-29 14:52:07

我还使用与霓虹灯相同的标志。根据优化级别 O3 或其他任何级别，不会对 neon 内部代码进行任何优化。它只是优化了 ARM 代码。

正如 Vasile 所说，通过用汇编语言编写 neon 代码可以获得最佳性能。
最简单的方法是编写一个使用内在霓虹灯代码的程序，并使用您提到的标志对其进行编译。现在使用为代码生成的汇编代码进行进一步优化。

通过并行化或利用 neon 的双指令功能可以完成大量优化。

回复收藏 0 原文

乞讨 2024-12-29 14:52:07

问题在于编译器不太擅长生成矢量化代码。因此，仅通过启用 NEON，您不会获得太多改进（也许 10%？？），

您可以做的是分析您的应用程序并使用 NEON 手动编写那些占用您时间的部分。如果您这样做，为什么不将它们修补到公共 OpenCV 源代码中呢？

到目前为止，OpenCV 几乎没有针对 NEON 进行优化的代码（对于 x86 SSE2，它的优化要好得多）。

回复收藏 0 原文

~没有更多了~

关于作者

静若繁花

暂无简介

文章

26 人气

关注发私信

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

使用 opencv 框架的 Objective C 项目的最佳编译器标志

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签