当前位置：文江博客话题详情

如何使用 blas 以最佳方式转置矩阵？

发布于 2024-12-09 20:13:59 字数 174 浏览 3 评论 0原文

我正在做一些计算，并对不同 BLAS 实现的优势和弱点进行一些分析。但是我遇到了一个问题。

我正在测试 cuBlas，在 GPU 上执行 linAlg 似乎是一个好主意，但有一个问题。

cuBlas 实现使用列主格式，并且由于这不是我最终需要的，我很好奇是否有一种方法可以使 BLAS 进行矩阵转置？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

莫多说 2024-12-16 20:13:59

BLAS 没有内置的矩阵转置例程。CUDA SDK 包含一个矩阵转置示例以及一篇讨论执行转置的最佳策略的论文。您的最佳策略可能是使用 CUBLAS 的行主要输入以及调用的转置输入版本，然后在列主要中执行中间计算，最后使用 SDK 转置内核执行转置操作。

编辑补充说，CUBLAS 在 CUBLAS 版本 5 中添加了一个转置例程，geam，它可以在 GPU 内存中执行矩阵转置，并且应该被视为最适合您使用的任何架构。

回复收藏 0 原文

~没有更多了~

关于作者

在巴黎塔顶看东京樱花

暂无简介

文章

26 人气

关注发私信

佚名

文章 0 评论 0

关注

羁客

文章 0 评论 0

关注

天天爱笑的徐老师

文章 0 评论 0

关注

星

文章 0 评论 0

关注

夏日落

文章 0 评论 0

关注

隐诗

文章 0 评论 0

友情链接

文江博客

如何使用 blas 以最佳方式转置矩阵？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

如何使用 blas 以最佳方式转置矩阵？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

佚名

羁客

天天爱笑的徐老师

星

夏日落

隐诗

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。