当前位置：文江博客话题详情

SIMD编程语言

发布于 2024-08-04 12:53:46 字数 1540 浏览 9 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

凡尘雨 2024-08-11 12:53:46

所以最近英特尔发布了 ISPC 这正是我在问这个问题时所寻找的。它是一种可以与普通 C 代码链接的语言，具有隐式执行模型，并支持开始帖子中提到的所有功能（混合运算符、分支、数据结构、矢量操作、着色器等）并针对 SSE2、SSE4 进行编译， AVX、AVX2 和 Xeon Phi 矢量指令。

回复收藏 0 原文

死开点丶别碍眼 2024-08-11 12:53:46

你最好的选择可能是 OpenCL。我知道它主要被宣传为在 GPU 上运行代码的一种方式，但 OpenCL 内核也可以在 CPU 上编译和运行。 OpenCL 基本上是 C，但有一些限制：

没有函数指针
没有递归

和一堆添加。特别是向量类型：

float4 x = float4(1.0f, 2.0f, 3.0f, 4.0f);
float4 y = float4(10.0f, 10.0f, 10.0f, 10.0f);

float4 z = y + x.s3210 // add the vector y with a swizzle of x that reverses the element order

需要注意的是，代码必须完全可操作，OpenCL 无法调用任意库等。但是，如果您的计算内核相当独立，那么您基本上会得到一个向量增强的 C，而您不需要不需要使用内在函数。

这里是包含所有扩展的快速参考/备忘单。

Your best bet is probably OpenCL. I know it has mostly been hyped as a way to run code on GPUs, but OpenCL kernels can also be compiled and run on CPUs. OpenCL is basically C with a few restrictions:

No function pointers
No recursion

and a bunch of additions. In particular vector types:

float4 x = float4(1.0f, 2.0f, 3.0f, 4.0f);
float4 y = float4(10.0f, 10.0f, 10.0f, 10.0f);

float4 z = y + x.s3210 // add the vector y with a swizzle of x that reverses the element order

On big caveat is that the code has to be cleanly sperable, OpenCL can't call out to arbitrary libraries, etc. But if your compute kernels are reasonably independent then you basically get a vector enhanced C where you don't need to use intrinsics.

Here is a quick reference/cheatsheet with all of the extensions.

回复收藏 0 原文

爱要勇敢去追 2024-08-11 12:53:46

它并不是真正的语言本身，但有一个 Mono 库（Mono.Simd），它将向您公开向量，并尽可能将它们的操作优化到 SSE 中：

回复收藏 0 原文

眼趣 2024-08-11 12:53:46

它是一个 C++ 库，而不是内置于该语言中，但是一旦声明了变量，Eigen 就几乎不可见了。

回复收藏 0 原文

箜明 2024-08-11 12:53:46

目前最好的解决方案是自己为 Nvidia 发布的开源 Cg 前端创建一个后端，但我想节省自己的精力，所以我很好奇以前是否有人这样做过。我最好立即开始使用它。

回复收藏 0 原文

会傲 2024-08-11 12:53:46

D 编程语言还以与 Mono.SIMD 类似的方式提供对 SIMD 的访问。

回复收藏 0 原文

阳光的暖冬 2024-08-11 12:53:46

这就是您正在寻找的 Fortran。如果内存足够，即使是开源编译器（g95、gfortran）也会利用 SSE（如果它是在您的硬件上实现的）。

回复收藏 0 原文

装迷糊 2024-08-11 12:53:46

我知道这个问题有点老了，但我发现自己处于类似的困境，并决定我应该自己做。

我还没有走得太远，但如果你对我正在探索的方向感兴趣，可能值得一看。 :)

https://github.com/HappMacDonald/MasterBlaster

MasterBlaster 是一种函数式编程语言，但它是将编译成字节码，最终是它自己的更简单的基于堆栈的语言，称为 Crude。然后直接编译成程序集。

我的策略是 SIMD 优先：未优化的可执行文件将几乎完全使用 SIMD，然后潜在的优化之一是将无法从 SIMD 受益的代码简化为仅使用通用寄存器。

Crude 已达到图灵完备阶段，但目前仅以几十个 GAS 宏的形式存在。我正在为其开发一个独立的编译器，并构建迭代器/生成器功能，这些功能是 SIMD 加速方面的明星。

目前还没有矢量矩阵等支持，但这已经在路线图上，在编写该语法时我可能会记住您的描述。 :)

回复收藏 0 原文

~没有更多了~

关于作者

要走干脆点

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

SIMD编程语言

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（8）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

SIMD编程语言

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（8）

关于作者

相关话题

热门标签

推荐作者

Promise

qq_lbRlsh

待＂谢繁草

yy2010hell

漫无边际

傲娇萝莉攻

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。