nvblas通过cblas

发布于 2025-02-10 08:04:33 字数 228 浏览 0 评论 0原文

我有一个C ++代码，并且使用CBLA来计算dgemm和dtrsm。我有兴趣使用GPU进行性能。通过我完成的测试，我可以使用nvblas.h使用NVBLA，但是它不接近CBLA。我想我可以将代码更改为dgemm就像nvblas.h一样。是否有一种更简单的方法可以使用NVBLA链接CBLA？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

孤独患者 2025-02-17 08:04:33

https://docs.nvidia.com/cuda/cuda/cuda/nvblas/nvblas/index.htmll#配置
由于NVBLA是Blas的倒数替换，因此必须通过ASCII文本文件进行配置，该文件描述了多少gpus可以参与截取的BLAS调用。配置文件在库加载时被解析。配置文件的格式基于关键字，然后是一个或多个用户定义的参数。最多允许每行关键字。以字符＃开头的空白行或行被忽略。

回复收藏 0 原文

~没有更多了~