CUDA 与 CuBlas 内存管理

发布于 2024-08-09 20:13:56 字数 175 浏览 2 评论 0原文

我注意到我可以使用使用 cudamalloc() 或 cublasalloc() 函数分配的矩阵内存块来调用 cublas 函数。尽管使用 cudamalloc() 分配的数组还有其他优点,但使用 cudamalloc() 而不是 cublasalloc() 分配的数组的矩阵传输速率和计算速度较慢。为什么会这样呢?很高兴听到一些评论。

I have noticed that I can use memory blocks for matrices either allocated using cudamalloc() or cublasalloc() function to call cublas functions. The matrix transfer rates and computational are slower for arrays allocated using cudamalloc() rather than cublasalloc(), although there are other advantages to using arrays using cudamalloc(). Why is that the case? It would be great to hear some comments.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

帥小哥 2024-08-16 20:13:56

cublasAlloc 本质上是 cudaMalloc() 的包装器,所以应该没有区别,您的代码中还有其他变化吗?

cublasAlloc is essentially a wrapper around cudaMalloc() so there should be no difference, is there anything else that changes in your code?

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文