需要参考：硬件架构与性能提升【HPC/并行计算】

发布于 2024-11-03 07:46:01 字数 221 浏览 2 评论 0原文

有多种方法可以提高 HPC 应用程序的性能。其中一种方法是根据硬件架构对应用程序进行微调。这种微调主要是在多核架构上完成的。为了使用这种方法，我们应该真正了解底层硬件架构，例如内存、插槽数量、每个插槽的核心数量、L1/L2 缓存、GFlops 等......

尽管这些技术术语看起来很熟悉，我仍然不清楚它对应用程序性能的确切含义。

任何人都可以推荐一个好地方/书，让我可以从性能方面了解硬件架构。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

你是暖光i 2024-11-10 07:46:01

将代码调整到目标硬件架构非常重要。然而，除非您有大量的时间和资源，否则对于各种各样的可用系统来说这是不可能的。

优化遵循 80-20 规则。你用20%的努力获得80%的收益。除此之外，你的回报将开始减少。

这是我遵循的过程：
1) 获取最适合您的目标架构的编译器。有时，GNU 可能是特定平台的最佳编译器，请不要感到惊讶。
2) 通读编译器的“代码优化”部分。
3) 确定正确的标志来为目标平台生成最佳代码。但是，请确保您尝试的每个优化级别都验证了代码的结果。较高的优化级别会影响代码的正确性。
4) 确保您需要的任何库都针对该系统进行了优化。例如，数学库、BLAS 库等。
5) 特别注意平台特定的硬件功能，例如 SSE (SIMD)、内核或加速器的数量。您可能需要修改代码或向编译器提供提示，以便更好地针对这些功能优化代码。

您必须对每个目标平台执行此操作。此时，您应该会看到以最小的努力获得最大的收益。

如果您需要获得更多性能，它几乎总是要求您重写代码以确保充分利用硬件功能。

不，没有这方面的书籍。最接近的是“优化手册”，通常由供应商免费提供（IBM 红皮书、Intel、AMD、Cray）。

前任：
support.amd.com/us/Processor_TechDocs/25112.PDF
http://www.intel.com/products/processor/manuals/
http://www.ibm.com/developerworks/wikis/download/attachments/137167333/Power6_optimization.pdf?version=1

这些是这些平台最有效的资源。您应该致力于为您的目标平台找到此类资源。