在 FORTRAN 中禁用矢量化循环？

发布于 2024-10-07 12:09:42 字数 349 浏览 9 评论 0原文

是否可以绕过 FORTRAN 中的循环向量化？我正在为特定项目编写 F77 标准，但 GNU gfortran 通过现代 FORTRAN 进行编译，例如 F95。有谁知道某些 FORTRAN 标准是否避免了循环矢量化，或者 gfortran 中是否有任何标志/选项可以将其关闭？

更新：所以，我认为我的具体问题的最终解决方案必须使用 FORTRAN DO 循环“DO”，不允许更新迭代变量。对此的提及可以在@High Performance Mark对此相关主题的回复中找到... 循环矢量化以及如何避免它

[进入堡垒，跑去躲避菜鸟。]

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

再可℃爱ぅ一点好了 2024-10-14 12:09:42

Fortran 标准通常对如何实现该语言保持沉默，将其留给编译器编写者，他们可以更好地确定在任何芯片架构上实现该语言的各种功能的最佳或好的（和坏的）选项(s) 他们正在为之写作。

当您写下要绕过循环矢量化时，您的意思是什么？并在下一句中暗示这对于 FORTRAN77 程序不可用？如果 CPU 能够遵守向量指令，那么现代 CPU 的编译器生成向量指令是完全正常的。无论程序是用什么版本的语言编写的，都是如此。

如果您真的不想生成向量指令，那么您必须仔细检查 gfortran 文档 - 它不是我使用的编译器，所以我不能指出您可以选择特定选项或标志。您可能想了解其特定于体系结构的代码生成功能，特别注意 SSE 级别。

如果您的所有循环都是显式的（因此没有整个数组操作）并且您使代码难以以其他方式矢量化（例如，循环迭代之间的依赖关系），您可能能够强制编译器不进行矢量化循环。但是一个好的现代编译器，在不受干扰的情况下，会为了你自己的利益而尽最大努力对循环进行矢量化。

对我来说，试图强迫编译器违背其本质似乎相当反常，也许您可以更详细地解释为什么要这样做。

回复收藏 0 原文

药祭#氼 2024-10-14 12:09:42

正如 High Performance Mark 所写，只要结果遵循语言规则，编译器就可以自由选择机器指令来实现源代码。您应该无法观察到循环矢量化导致的输出值的任何差异......您的代码应该运行得更快。那么你为什么关心呢？

有时可以在优化级别之间观察到差异，例如，在某些架构上寄存器具有额外的精度。

寻找此类编译器优化的地方是 gcc 手册。它们位于此处，因为它们在 gcc 编译器套件中很常见。

回复收藏 0 原文

合久必婚 2024-10-14 12:09:42

对于大多数现代编译器，命令行选项 -O0 应关闭所有优化，包括循环向量化。

我有时发现这会导致错误明显消失。然而，通常这意味着我的代码有问题，所以如果这种事情发生在你身上，那么你几乎肯定编写了一个有错误的程序。

理论上这是可能的，但编译器中存在错误的可能性要小得多，您可以通过在另一个 fortran 编译器中编译代码来轻松检查这一点。（例如 gfortran 或 g95）。

回复收藏 0 原文

—━☆沉默づ 2024-10-14 12:09:42

除非您设置了 -O3 或 -ftree-vectorize，否则 gfortran 不会自动矢量化。所以很容易避免矢量化。您可能需要阅读（浏览）gcc 手册以及 gfortran 手册。
35 年来，自动矢量化一直是 Fortran 编译器的众所周知的功能，甚至 Fortran 77 DO 循环的定义也是考虑到这一点（并且还考虑到一些已知的不可移植的 F66 标准滥用）。您不能指望关闭矢量化作为使不正确的代码正常工作的一种方法，尽管它可能会暴露不正确代码的症状。

回复收藏 0 原文

~没有更多了~