文章来源于网络收集而来,版权归原创者所有,如有侵权请及时联系!
SIMD 支持
VecElement{T}
类型是为了构建 SIMD 运算符的库。实际使用中要求使用 llvmcall
。类型按下文定义:
struct VecElement{T}
value::T
end
它有特别的编译规则:当 T
是初始位类型,并且元组长度属于集合 {2-6,8-10,16} 时,VecElement{T}
的同态元组会映射为一个 LLVM vector
类型。
使用 -O3
参数时,编译器 可能 自动为这样的元组向量化运算符。 例如接下来的程序,使用 julia -O3
编译,在x86系统中会生成两个 SIMD 附加指令(addps
):
const m128 = NTuple{4,VecElement{Float32}}
function add(a::m128, b::m128)
(VecElement(a[1].value+b[1].value),
VecElement(a[2].value+b[2].value),
VecElement(a[3].value+b[3].value),
VecElement(a[4].value+b[4].value))
end
triple(c::m128) = add(add(c,c),c)
code_native(triple,(m128,))
然而,因为无法依靠自动向量化,以后将主要通过使用基于 llvmcall
的库来提供 SIMD 支持。
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论