我应该用 C/C++ 重写我的 DSP 例程吗？或者我擅长 C# 不安全指针？

发布于 2024-07-08 04:24:54 字数 475 浏览 11 评论 0原文

我目前正在编写一个 C# 应用程序，该应用程序执行大量数字信号处理，其中涉及大量小型微调内存 xfer 操作。我使用不安全指针编写了这些例程，它们的性能似乎比我最初想象的要好得多。但是，我希望应用程序尽可能快。

用 C 或 C++ 重写这些例程是否会获得任何性能优势，或者我应该坚持使用不安全指针？我想知道与 C/C++ 相比，不安全指针在性能方面带来了什么。

编辑：我在这些例程中没有做任何特殊的事情，只是普通的 DSP 内容：缓存友好的数据从一个数组传输到另一个数组，其中包含大量乘法、加法、移位等。我希望 C/C++ 例程看起来与 C# 例程几乎相同（如果不相同）。

编辑：非常感谢大家的所有聪明答案。我了解到，除非进行某种 SSE 优化，否则仅通过直接移植不会显着提高性能。假设所有现代 C/C++ 编译器都可以利用它，我期待着尝试一下。如果有人对结果感兴趣，请告诉我，我会将其发布到某个地方。（不过可能需要一段时间）。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

坐在坟头思考人生 2024-07-15 04:24:54

实际上，我已经完成了几乎完全符合您要求的工作，只是在图像处理领域。我从 C# 不安全指针开始，然后转向 C++/CLI，现在我用 C++ 编写所有代码。事实上，从那时起，我从 C++ 中的指针更改为 SSE 处理器指令，所以我一路走来。还没有达到汇编器，虽然我不知道是否需要，我在 CodeProject 上看到一篇文章，表明 SSE 可以和内联汇编器一样快，如果你想要我可以找到它。

在我进行过程中，我的算法从使用不安全指针的 C# 中的每秒大约 1.5-2 帧，变为现在的每秒 40 帧。 C# 和 C++/CLI 肯定比 C++ 慢，即使使用指针，我也无法使用这些语言达到每秒 10 帧以上。当我切换到 C++ 后，我立即获得了每秒 15-20 帧的速度。经过一些更巧妙的更改，SSE 使我的速度达到了每秒 40 帧。所以，是的，根据我的经验，如果你想要速度，那么值得下去。有明显的性能增益。

回复收藏 0 原文

空袭的梦i 2024-07-15 04:24:54

优化 DSP 代码的另一种方法是使其缓存友好。如果您有很多过滤器要应用于您的信号，您应该将所有过滤器应用于每个点，即您最内层的循环应该在过滤器上而不是在数据上，例如：

for each n do t´[n] = h(g(f(t[n])))

这样您将减少缓存的垃圾并且将最有可能获得良好的速度提升。

Another way to optimize DSP code is to make it cache friendly. If you have a lot of filters to apply to your signal you should apply all the filters to each point, i.e. your innermost loop should be over the filters and not over data, e.g.:

for each n do t´[n] = h(g(f(t[n])))

This way you will trash the cache a lot less and will most likely gain a good speed increase.

回复收藏 0 原文

野鹿林 2024-07-15 04:24:54

我认为你应该用 C++（托管或非托管）或 C# 编写 DSP 例程，使用可靠的设计，但不要尝试从一开始就优化所有内容，然后你应该分析你的代码并找到瓶颈并尝试优化它们离开。

尝试从一开始就生成“最佳”代码将会分散您对编写工作代码的注意力。请记住，80% 的优化只会影响 20% 的代码，因为在很多情况下，只有 10% 的代码负责 90% 的 CPU 时间。（YMMV，因为它取决于应用程序的类型）

当我试图优化图形工具包中 alpha 混合的使用时，我首先尝试以“裸机”方式使用 SIMD：内联汇编器。很快我发现使用 SIMD 内在函数比纯汇编更好，因为编译器能够通过重新排列各个操作码并最大化 CPU 中不同处理单元的使用来进一步优化具有内在函数的可读 C++。

不要低估编译器的力量！

回复收藏 0 原文

り繁华旳梦境 2024-07-15 04:24:54

我可以获得任何性能优势吗
用 C/C++ 重写这些例程
或者我应该坚持使用不安全的指针？

从理论上讲，这并不重要 - 完美的编译器会将代码（无论是 C 还是 C++）优化为最好的汇编程序。

然而，实际上，C 几乎总是更快，特别是对于指针类型算法 - 它尽可能接近机器代码，而无需进行汇编编码。

C++ 在性能方面没有带来任何好处 - 它是作为 C 的面向对象版本构建的，为程序员提供了更多的功能和易用性。虽然对于某些事情它会执行得更好，因为给定的应用程序将受益于面向对象的观点，但它并不意味着执行得更好 - 它的目的是提供另一个抽象级别，以便更容易地编写复杂的应用程序。

因此，不，切换到 C++ 可能不会带来性能提升。

然而，对你来说，找出答案可能比避免花时间在它上面更重要——我认为移植它并分析它将是一项值得的活动。如果您的处理器有某些用于 C++ 或 Java 使用的指令，并且编译器知道它们，那么它很可能能够利用 C 中不可用的功能。不太可能，但有可能。

然而，众所周知，DSP 处理器是非常复杂的野兽，越接近汇编，获得的性能就越好（即，您的代码需要手工调整得越多）。 C 比 C++ 更接近汇编。

-亚当

回复收藏 0 原文

梦魇绽荼蘼 2024-07-15 04:24:54

首先让我回答有关“安全”与“不安全”的问题：您在帖子中说“我希望应用程序尽可能快”，这意味着您不想混淆“安全”或“托管”指针（甚至不提垃圾收集）。

关于您选择的语言：
C/C++ 让您可以更轻松地处理底层数据，而无需承担与当今每个人都在使用的精美容器相关的任何开销。是的，被容器拥抱着很好，可以防止您出现段错误……但是与容器相关的更高级别的抽象毁坏了您的性能。

在我的工作中，我们的代码必须快速运行。一个例子是我们工作中的多相重采样器，它使用指针和掩码操作以及定点 DSP 滤波...如果没有对内存和位操作的低级控制，这些巧妙的技巧实际上都不可能实现 ==> 所以我说坚持使用 C/C++。

如果你真的想变得聪明，用低级 C 编写所有 DSP 代码。然后将其与更安全的容器/托管指针混合在一起......当它达到速度时，你需要取下辅助轮......它们会减慢速度你太沮丧了。

（仅供参考，关于取下辅助轮：您需要额外离线测试您的 C DSP 代码，以确保它们的指针使用良好...o/w 它会出现段错误。）

编辑：ps“段错误”是一种奢侈适合所有 PC/x86 开发人员。当您编写嵌入式代码时...段错误仅意味着您的处理器将进入 wuides 并且只能通过电源循环恢复；）。

回复收藏 0 原文

何必那么矫情 2024-07-15 04:24:54

为了了解如何获得性能提升，最好了解可能导致瓶颈的代码部分。

由于您谈论的是小型内存传输，我假设所有数据都适合 CPU 的缓存。在这种情况下，您可以获得的唯一好处就是了解如何使用 CPU 的内在函数。通常，最熟悉 CPU 内在函数的编译器是 C 编译器。所以在这里，我认为你可以通过移植来提高性能。

另一个瓶颈是 CPU 和内存之间的路径 - 由于应用程序中存在大量内存传输而导致缓存未命中。最大的好处在于最大限度地减少缓存未命中，这取决于您使用的平台以及数据的布局（是本地的还是通过内存分布的？）。

但由于您已经在使用不安全的指针，因此您可以自己控制这一点，所以我的猜测是：在这方面，您不会从 C（或 C++）的移植中受益匪浅。

结论：您可能希望将应用程序的一小部分移植到 C 中。

回复收藏 0 原文

动次打次papapa 2024-07-15 04:24:54

看到您已经在编写不安全的代码，我认为将其转换为 C dll 并从 C# 中调用它们会相对容易。在确定程序中最慢的部分后执行此操作，然后将其替换为 C。

回复收藏 0 原文

°如果伤别离去 2024-07-15 04:24:54

你的问题很大程度上是哲学问题。答案是：在进行分析之前不要进行优化。

你问你是否会获得进步。好吧，你将获得 N% 的进步。如果这就足够了（就像您需要在某些嵌入式系统上 20 毫秒内执行 200 次的代码），那就没问题了。但如果还不够怎么办？

你必须先衡量，然后找出代码的某些部分是否可以用相同的语言重写，但速度更快。也许您可以重新设计数据结构以避免不必要的计算。也许你可以跳过一些内存重新分配。也许某件事可以用线性复杂度来完成，但却用二次复杂度来完成。在测量之前您不会看到它。这通常比用另一种语言重写所有内容要少得多地浪费时间。

回复收藏 0 原文

空城缀染半城烟沙 2024-07-15 04:24:54

C# 不支持 SSE（但是，有一个用于 SSE 操作的 mono 项目）。因此使用 SSE 的 C/C++ 肯定会更快。

但是，您必须小心托管到本机和本机到托管的转换，因为它们非常昂贵。尽可能在这两个世界中停留尽可能长的时间。

回复收藏 0 原文

歌入人心 2024-07-15 04:24:54

您真的希望应用程序尽可能快还是只是足够快？这会告诉您下一步应该做什么。

回复收藏 0 原文

还在原地等你 2024-07-15 04:24:54

如果您坚持使用手动操作，而不在汇编程序或类似程序中进行手动优化，那么 C# 应该没问题。不幸的是，这是一种只能通过实验才能真正回答的问题。您已经处于非托管指针空间中，因此我的直觉是直接移植到 C++ 不会在速度上出现显着差异。

不过，我应该说，我最近也遇到了类似的问题，在尝试了英特尔集成性能基元库。我们在那里看到的性能改进非常令人印象深刻。

回复收藏 0 原文

嘦怹 2024-07-15 04:24:54

Mono 2.2 现在具有 SIMD 支持，您可以两全其美托管代码和原始速度。

您可能还想看看在 C# 中使用 SSE 可能吗？

回复收藏 0 原文

青柠芒果 2024-07-15 04:24:54

我建议，如果您的 DSP 代码中有任何需要优化的算法，那么您应该用汇编语言编写它们，而不是 C 或 C++。

一般来说，对于现代处理器和硬件，没有那么多场景需要或保证需要进行优化。您是否确实发现了任何性能问题？如果没有，那么最好坚持现有的。在大多数简单算术情况下，不安全的 C# 不太可能比 C/C++ 慢很多。

您考虑过 C++/CLI 吗？那么你就可以两全其美了。如果需要的话，它甚至允许您使用内联汇编器。

回复收藏 0 原文

~没有更多了~

关于作者

风吹雪碎

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

我应该用 C/C++ 重写我的 DSP 例程吗？或者我擅长 C# 不安全指针？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（13）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

我应该用 C/C++ 重写我的 DSP 例程吗？ 或者我擅长 C# 不安全指针？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（13）

关于作者

相关话题

热门标签

推荐作者

1CH1MKgiKxn9p

ゞ记忆︶ㄣ

JackDx

信远

yaoduoduo1995

霞映澄塘

友情链接

我应该用 C/C++ 重写我的 DSP 例程吗？或者我擅长 C# 不安全指针？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。