托管 C++ 的性能与非托管/本机 C++

发布于 2024-09-05 07:31:40 字数 265 浏览 9 评论 0原文

我正在编写一个非常高性能的应用程序，每毫秒处理和处理数百个事件。

非托管 C++ 比托管 C++ 更快吗？为什么？

托管 C++ 处理 CLR 而不是操作系统，并且 CLR 负责内存管理，这简化了代码，并且可能比“程序员”在非托管 C++ 中编写的代码更高效？还是有其他原因？使用托管时，如果动态内存分配对程序员来说是透明的并由 CLR 处理，那么如何避免动态内存分配（这会导致性能下降）？

回到我的问题，托管 C++ 在速度方面比非托管 C++ 更高效吗？为什么？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

握住你手 2024-09-12 07:31:40

对此没有一个答案。作为一条真正的一般规则，本机代码通常会更快，但 1）情况并非总是如此，2）有时差异太小而无需关心，3）代码编写得如何通常会比托管与非托管产生更大的差异。

托管代码在虚拟机中运行。基本上，您从生成字节码作为输出的编译器开始，然后将其提供给虚拟机。然后，虚拟机将其重新编译为机器代码并执行。在某些情况下，这可以提供一些真正的优势。举个例子，如果您有一个运行 64 位 VM 的 64 位处理器（几乎已经是给定的了），但在 64 位处理器普及之前编写的旧程序，VM 仍会将该字节代码编译为 64-位机器代码，至少对于某些代码来说可以提供相当大的速度优势。

同时，对于某些代码来说，这也可能是一个相当明显的缺点。特别是，编译器在用户等待时运行。为了适应这一点，虚拟机的编译器本身不能运行得很慢。尽管本机代码生成器有所不同，但无论您选择哪种本机编译器，都很有可能至少包含虚拟机字节码编译器中放弃的一些优化，以保持其资源使用合理。

VM 还使用垃圾收集器。垃圾收集器与手动管理内存具有相当不同的特征。对于许多手动管理器来说，分配内存相当昂贵。释放内存相当便宜，但与释放的项目数量大致呈线性关系。其他手动管理器大致相反，在释放内存时做额外的工作以使分配更快。无论哪种方式，成本结构都与典型的收集器不同。

使用垃圾收集器，分配内存通常非常便宜。对于典型的（复制）收集器，释放内存的成本主要取决于已分配且仍在（至少可能）使用的对象数量。

但分配本身也有所不同。在本机 C++ 中，您通常在堆栈上创建大多数对象，其中分配和释放内存都非常便宜。在托管代码中，您通常会动态分配更大比例的内存，并在其中进行垃圾收集。

There is no one answer to this. As a really general rule, native code will usually be faster, but 1) that's not always the case, 2) sometimes the difference is too small to care about, and 3) how well the code is written will usually make more difference than managed vs. unmanaged.

Managed code runs in a virtual machine. Basically, you start with a compiler that produces byte codes as output, then feed that to the virtual machine. The virtual machine then re-compiles it to machine code and executes that. This can provide some real advantages under some circumstances. For one example, if you have a 64-bit processor running a 64-bit VM (pretty nearly a given any more) but and old program written before 64-bit processors were common, the VM will still compile that byte code to 64-bit machine code, which can give quite a substantial speed advantage for at least some code.

At the same time, it can also be a fairly noticeable disadvantage for some code. In particular, the compiler is running while the user waits. To accommodate that, the VM's compiler can't itself run very slowly. Although native code generators differ, there's a pretty fair chance that whatever native compiler you choose includes at least a few optimizations that were foregone in the VM's bytecode compiler to keep its resource usage reasonable.

The VM also uses a garbage collector. Garbage collectors have rather different characteristics from manually managing memory. With many manual managers, allocating memory is fairly expensive. Releasing memory is fairly cheap, but roughly linear on the number of items you release. Other manual managers roughly reverse that, doing extra work when freeing memory in order to make allocation faster. Either way, the cost structure is different from a typical collector.

With a garbage collector, allocating memory is typically very cheap. With a typical (copying) collector, the cost of releasing memory depends primarily upon the number of objects that have been allocated and are still (at least potentially) in use.

The allocations themselves also differ though. In native C++, you typically create most objects on the stack, where both allocating and releasing memory is extremely cheap. In managed code, you typically allocate a much larger percentage of memory dynamically, where it's garbage collected.

回复收藏 0 原文

心在旅行 2024-09-12 07:31:40

这一切都取决于具体情况。

使非托管代码更快/托管代码更慢的事情：

代码需要在执行之前转换为机器代码
垃圾收集可能会导致
从托管代码到非托管代码的开销调用具有严重的开销
非托管编译器可以优化更多，因为它们直接生成机器代码（我自己看到）

使托管代码更快/非托管代码更慢的事情：

由于代码在使用之前转换为机器代码，因此可以针对实际处理器优化托管代码（使用非托管代码，您必须以“最小”为目标- 支持的处理器）。

可能还有更多原因。

回复收藏 0 原文

两仪 2024-09-12 07:31:40

你可以用任何语言编写慢速代码；相反，您可以使用几乎任何语言都可能很快的不错的算法。

这里常见的答案是选择一种您已经了解的语言，使用适当的算法，然后对其进行分析以确定实际的热点。

我有点担心每毫秒数百个事件的声明。这是一个非常多的数字。您是否能够以任何语言进行您期望的处理？

作为高性能系统上的 C++ 开发人员，我倾向于相信自己分析和优化所发出代码的能力。也就是说；有非常高性能的 .NET 应用程序，其中作者竭尽全力不在关键循环内进行动态内存分配 - 主要是通过使用预先创建的对象分配池。

因此，重复我之前的评论：选择你已经知道的内容，然后进行调整。即使你走进了死胡同；您可能会更多地了解您的问题空间。

回复收藏 0 原文

贪恋 2024-09-12 07:31:40

在大多数情况下，托管代码比非托管代码慢，尽管 .Net CLR 在执行代码之前始终执行 JIT 编译（程序运行时不会多次编译，但它永远不会解释代码）。

问题在于 CLR 所做的许多检查，例如，每当您尝试访问数组时，看看是否超出了数组的范围。这会减少缓冲区溢出等问题，但也意味着由于这些检查的额外开销而导致性能下降。

我见过 C# 优于 C++ 的实验，但这些实验是通过充分利用对象层次结构等的代码进行的。当涉及到数字运算并且您想充分利用您的 PC 时，您将不得不使用非托管代码。

另一点也已经提到过——当必须释放内存时，GC 会导致程序执行中出现一些不可预测的暂停。在非托管代码中进行内存管理时，您也需要这个时间，但它会更频繁地发生，每当您决定销毁一个对象时，这意味着整个程序不会立即完成所有操作，因此您不会有长时间的停顿。

回复收藏 0 原文

盛夏已如深秋| 2024-09-12 07:31:40

这里有很多好的答案，但从长远来看，托管代码可能具有优势的一个方面是运行时分析。由于托管编译器生成的代码是中间格式，因此可以根据实际使用情况对实际执行的机器代码进行优化。如果某个特定的功能子集被大量使用，JIT 人员可以将机器代码全部本地化到同一内存页上，从而增加局部性。如果从特定方法重复进行特定子调用，JIT 人员可以动态内联它。

这是对非托管代码的改进，在非托管代码中，内联必须提前“猜测”，过度内联是有害的，因为它会使代码大小膨胀并导致局部性问题，从而导致（非常耗时的）L2/L1 缓存未命中。该信息根本无法用于静态分析，因此只能在 JIT 环境中进行。运行时分析有很多可能的好处，例如优化循环展开等。

我并不是说 .NET JIT'er 尽可能聪明，但我知道我听说过全局分析功能，并且我众所周知，惠普和其他公司已经对运行时分析进行了大量研究。

回复收藏 0 原文

有深☉意 2024-09-12 07:31:40

首先，您的声明“每毫秒处理数百个事件”。听起来很不现实。除非你的计算机中有专门设计的时钟模块，否则我不认为你可以用通用的PC来实现这个目标（典型的分辨率约为10毫秒）。其次，Native C++ 在性能方面要好得多。在 C++ 方面可以采取很多优化来加速，而在托管代码中则不可能。另请注意，托管代码中的垃圾收集会使性能变得不可预测 - 当 GC 启动时，整个进程都会被冻结。一旦遇到问题，解决方案就更加痛苦，现在托管代码提供的所有“漂亮风格”都将消失。

至于管理代码可以针对 CPU 进行优化的能力，这是事实，但您也可以在本机 C++ 中利用 CPU 功能（SSE2、MMX 等）。根据我的经验，性能提升可以忽略不计。

回复收藏 0 原文

蓝天 2024-09-12 07:31:40

编写快速代码，始终是一种痛苦。您可以仅针对一个平台进行优化的主要问题。这实际上是控制台、嵌入式或其他硬件始终相同的平台上的情况。在现实的 PC 世界中，情况并非如此。不同的核心、不同的指令ecc……让这成为一场噩梦。恕我直言，这是主要问题，它确实使 man/unam 代码之间产生了差异。男人。代码在运行时可以针对新平台进行乐观优化。无人代码不是，是写进石头里的。

回复收藏 0 原文