编译器如何处理 SSE（或任何）内部函数？

发布于 2024-11-01 08:55:32 字数 152 浏览 7 评论 0原文

不久前，我在某处读到 SSE 内部函数可以编译成高效的机器代码，因为编译器对待它们的方式与普通函数不同。我想知道编译器实际上是如何做到这一点的，以及 C 程序员可以做些什么来促进这个过程。是否有任何关于如何使用内部函数以使编译器更轻松地生成高效机器代码的工作的指南？

谢谢。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

清秋悲枫 2024-11-08 08:55:32

与 Necrolis 所写的相反，内在函数可能会也可能不会编译成它们所代表的指令。对于复制或加载指令（例如 _mm_load_pd）尤其如此，因为编译器在使用内部函数时仍然负责寄存器分配和赋值。这意味着如果两个位置可以由同一寄存器表示，则根本不需要将值从一个位置复制到另一个位置。在这种情况下，编译器可能会选择删除该副本。如果从未使用过结果，它也可能选择删除其他指令。

查看这篇博文，其中不同编译器的行为是实践中比较。这是 2009 年的内容，因此详细信息可能不再适用。然而，较新的编译器可能会更多地而不是更少地优化您的代码。

至于实际有效地使用内在函数，答案与所有其他性能优化相同：测量、测量和测量。确保您实际上正在处理一段热门代码，找出它缓慢的原因，然后改进它。您很可能会发现改进内存访问模式比使用内在函数更重要。

回复收藏 0 原文