blas

blas

文章 2 浏览 49

我该如何修复这个 C 代码/BLAS 错误?

我正在尝试编写使用 R 中的 BLAS lib 的 ac 函数(稍后将在 R 脚本中使用) #include #include #include void foo(int *dimension, double *vect1, do…

一个人的夜不怕黑 2024-10-31 00:07:07 8 0

CUBLAS 矩阵乘法

使用 CUDA 实现矩阵乘法后。我尝试用 CUBLAS 来实现它(感谢论坛中一些人的建议)。 我可以乘方阵,但是(是的,再一次......)我在处理非方阵时遇到…

一袭水袖舞倾城 2024-10-30 14:01:25 10 0

读取矩阵并对其进行操作 BLAS

如果一个矩阵是内存映射的,我需要分块读取它并处理它,因为它有点大,如何在 BLAS 中逐块读取它并处理它?…

む无字情书 2024-10-26 23:31:15 7 0

CUBLAS - 矩阵加法..如何?

我正在尝试使用 CUBLAS 对两个未知大小的大矩阵求和。我需要一个完全优化的代码(如果可能),所以我选择不重写矩阵加法代码(简单),而是使用 CUBLA…

葬花如无物 2024-10-26 00:58:22 9 0

处理器子集上的不相交网格及其在 Scalapack 中的通信

总之,我的问题是关于如何在 Scalapack (BLACS) 中两个不同进程网格上的两个块循环分布矩阵之间实现矩阵复制。我正在尝试使用 pdgemr2d_ 来实现这一点…

小情绪 2024-10-24 04:39:39 7 0

使用非零值初始化双精度数组 (BLAS)

我分配了一个大的双向量,假设有 100000 个元素。在我的代码中的某个时刻,我想将所有元素设置为常量、非零值。如何在不对所有元素使用 for 循环的情…

〆一缕阳光ご 2024-10-21 03:15:56 8 0

LAPACK/BLAS 与简单的“for”比较循环

我想将一段涉及大量向量和矩阵计算的代码迁移到 C 或 C++,目标是尽可能加快代码速度。 C 代码中使用 for 循环进行的线性代数计算是否与使用 LAPACK/B…

静待花开 2024-10-18 11:20:14 7 0

如何计算上三角矩阵的 SVD(奇异值分解)

您知道使用 BLAS 或 LAPACK 计算 SVD 的算法吗? 假设我有一个对称矩阵 A: 1 22 13 14 22 1 45 24 13 45 1 34 14 24 34 1 从 A 得到上三角矩阵 G 后…

孤独患者 2024-10-18 08:06:14 13 0

预编译Windows OMF BLAS/LAPACK?

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…

油饼 2024-10-17 03:46:37 22 0

在典型的 Fortran 程序中使用 macports 中的 ATLAS/Lapack

我正在尝试用 mpi 和 fortran 编写一个简单的微分方程求解器。我想我也可以熟悉使用 ATLAS/LAPACK/BLAS 例程,因为它们似乎对我将来可能做的任何数值…

公布 2024-10-10 21:49:51 14 0

iOS 4 使用 4x4 矩阵加速 Cblas

我一直在研究 iOS 4 中提供的 Accelerate 框架。具体来说,我尝试在 C 语言的线性代数库中使用 Cblas 例程。现在我无法使用这些函数来给我提供帮助与…

彩虹直至黑白 2024-09-27 23:03:02 7 0

有没有关于 cblas 接口的好的文档?

Closed. This question does not meet Stack Overflow guidelines. It is not currently accepting answers. 要求我们推荐或查找工具、库或最喜欢的…

挽清梦 2024-09-26 13:45:40 8 0

cblas_dgemm - 正确的参数:错误消息

我正在尝试使用 cblas_dgemm() 计算:C = 1*(A*B') + 0*C。 据我所知,参数是正确的。 错误消息本身没有意义: "ldb must be >= MAX(K,1): ldb=3 K=3P…

如若梦似彩虹 2024-09-25 21:30:25 8 0

cblas_dgemm - 仅当(beta)是二的幂时才有效

我完全被难住了。我有一个用 c 编写的相当大的递归程序,它调用 cblas_dgemm()。结果由正确运行的程序独立验证。 C = alpha*A*B + beta*C 在使用随机…

酒绊 2024-09-24 06:04:19 20 0

在 BLAS 中转置还是先自己做?

我正在用 Fortran 77 编写一些科学代码,并且正在讨论什么会更快。 基本上,我有一个 MxN 矩阵,我们称之为 A。M 大于 N。稍后在代码中,我需要将转置…

碍人泪离人颜 2024-09-19 07:44:13 16 0
更多

推荐作者

夢野间

文章 0 评论 0

百度③文鱼

文章 0 评论 0

小草泠泠

文章 0 评论 0

zhuwenyan

文章 0 评论 0

weirdo

文章 0 评论 0

坚持沉默

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文