当前位置：文江博客话题详情

GCC c++ c compiler-construction vectorization

矢量化是什么意思？

发布于 2024-08-06 09:19:14 字数 45 浏览 8 评论 0原文

对代码进行矢量化是个好主意吗？何时执行此操作有哪些良好做法？下面会发生什么？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（5）

倒带 2024-08-13 09:19:14

矢量化意味着编译器检测到您的独立指令可以作为一条 SIMD 指令执行。通常的例子是，如果你做类似的事情

for (i = 0; i < N; i++) {
    a[i] = a[i] + b[i];
}

它将被向量化为（使用向量表示法）

for (i = 0; i < (N - N % VF); i += VF) {
    a[i : i + VF] = a[i : i + VF] + b[i : i + VF];
}

基本上编译器会选择一个可以同时对数组的 VF 元素执行的操作，并执行 N/VF 次而不是执行单次操作N次。

它提高了性能，但对架构提出了更多要求。

Vectorization means that the compiler detects that your independent instructions can be executed as one SIMD instruction. Usual example is that if you do something like

for (i = 0; i < N; i++) {
    a[i] = a[i] + b[i];
}

It will be vectorized as (using vector notation)

for (i = 0; i < (N - N % VF); i += VF) {
    a[i : i + VF] = a[i : i + VF] + b[i : i + VF];
}

Basically the compiler picks one operation that can be done on VF elements of the array at the same time and does this N/VF times instead of doing the single operation N times.

It increases performance, but puts more requirement on the architecture.

回复收藏 0 原文

锦上情书 2024-08-13 09:19:14

如上所述，矢量化用于利用 SIMD 指令，它可以对打包到大型寄存器中的不同数据执行相同的操作。

使编译器能够自动矢量化循环的通用准则是确保循环的不同迭代中不存在流依赖和反依赖黑白数据元素。

http://en.wikipedia.org/wiki/Data_dependency

一些编译器，例如 Intel C++/Fortran编译器能够自动向量化代码。如果无法对循环进行矢量化，英特尔编译器能够报告无法执行此操作的原因。这些报告可用于修改代码，使其变得可矢量化（假设可能）。

“优化现代架构的编译器：基于依赖关系的方法”一书中深入介绍了依赖关系

回复收藏 0 原文

浅唱々樱花落 2024-08-13 09:19:14

矢量化不必局限于可以容纳大量数据的单个寄存器。就像使用“128”位寄存器来保存“4 x 32”位数据一样。这取决于架构限制。某些架构具有不同的执行单元，这些执行单元具有自己的寄存器。在这种情况下，可以将部分数据馈送到该执行单元，并且可以从与该执行单元对应的寄存器中获取结果。

例如，考虑以下情况。

for(i=0; i < N; i++)
{
a[i] =
a[i] + b[i];
}

如果我正在开发一个具有两个执行单元的架构，那么我的向量大小定义为 2。上面提到的循环将被重新构造为

for(i=0; i<(N/2); i+=2)
{
a[i] = a[i] + b[i] ;
a[i+1] = a[i+1] + b[i+1];
}
注意：for 语句中的 2
从向量大小导出。

由于我有两个执行单元，循环内的两个语句将被输入到两个执行单元中。总和将分别累加到执行单元中。最后将计算累加值（来自两个执行单元）的总和。

好的做法是
1. 在对循环进行矢量化之前，需要检查依赖性（循环的不同迭代之间）等约束。
2.需要防止函数调用。
3. 指针访问会产生别名，需要加以防止。

回复收藏 0 原文

找个人就嫁了吧 2024-08-13 09:19:14

这是 SSE 代码生成。

您有一个包含浮点矩阵代码的循环matrix1[i][j] + matrix2[i][j]，编译器生成SSE代码。

回复收藏 0 原文

池木 2024-08-13 09:19:14

也许还可以看看 libSIMDx86 （源代码）。

一个很好解释的例子是：

选择避免分支：Altivec 的一个小例子

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

琉璃梦幻

文章 0 评论 0

qq_4zWU6L

文章 0 评论 0

话少情深

文章 0 评论 0

西西弗的石头怪

文章 0 评论 0

彻夜缠绵

文章 0 评论 0

千寻…

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文