blas

blas

文章 2 浏览 47

是否值得在 Python 中使用多线程 blas 实现和多处理?

假设我有一台 16 核机器,和一个令人尴尬的并行程序。我使用了大量的 numpy 点积和 numpy 数组的添加,如果我不使用多处理,那将是理所当然的:确保 n…

︶ ̄淡然 2024-12-09 21:33:34 1 0

如何使用 blas 以最佳方式转置矩阵?

我正在做一些计算,并对不同 BLAS 实现的优势和弱点进行一些分析。但是我遇到了一个问题。 我正在测试 cuBlas,在 GPU 上执行 linAlg 似乎是一个好主…

在巴黎塔顶看东京樱花 2024-12-09 20:13:59 0 0

使用 BLAS 将实矩阵与复向量相乘

如何使用 Blas 将实数矩阵与复数向量相乘?当我使用 ccsrgemv() 等函数时,出现类型不匹配错误? error: argument of type "float *" is incompatible…

伴我心暖 2024-12-07 10:05:43 0 0

基准测试(python 与 c++ 使用 BLAS)和(numpy)

我想编写一个广泛使用 BLAS 和 LAPACK 线性代数功能的程序。由于性能是一个问题,我做了一些基准测试,想知道我采取的方法是否合法。 可以这么说,我…

み零 2024-12-07 02:06:01 1 0

将 GotoBLAS2 与 C 一起使用

我是 C 编码的新手,但我已经编写了一个用于模拟神经网络的 Matlab 程序,我希望将其转换为 C 代码,因为我们的超级计算机集群不允许同时运行多个 Mat…

傲鸠 2024-12-02 04:37:37 0 0

Mac LION 上的 Lapack 版本

Lapack 3.2.1 并不完全安全……但是 netlib 最近在 intel 的帮助下发布了 3.3。 那么有人知道 Lapack 3.3 版本是否会随新 MacPro 一起提供吗?…

长伴 2024-12-01 12:40:57 0 0

静态链接 LAPACK

我正在尝试发布一些软件,目前正在编写构建过程的脚本。我被困在我从未想过会做的事情上,在 x86_64 linux 上静态链接 LAPACK。在配置期间,AC_SEARCH…

放血 2024-12-01 05:25:37 1 0

在汇编中实现矩阵向量乘法

我有一种算法,可以一遍又一遍地执行线性代数的树步骤, loop{ first I multiply a Vector and a Matrix, Second I calculate the sum of elements in…

や莫失莫忘 2024-12-01 03:37:26 0 0

BLAS:gemm 与 gemv

为什么 BLAS 有一个用于矩阵-矩阵乘法的gemm函数和一个单独的用于矩阵-向量乘法的gemv函数?矩阵-向量乘法不是矩阵-矩阵乘法的一种特殊情况,其中一个…

夏の忆 2024-11-29 19:26:27 0 0

用于进行高斯消除的 BLAS/LAPACK 例程

我是 BLAS/Lapack 的新用户,我只是想知道是否有一个例程可以进行高斯消除甚至高斯约尔丹消除?我用谷歌搜索并查看了他们的文档,但仍然找不到它们。 …

债姬 2024-11-28 09:31:56 0 0

需要一个稀疏矩阵库

是否有一个稀疏矩阵库可以复制密集 BLAS 的功能? 我至少想要: 具有稀疏输入(可能还有密集输出)的高效 SYR 和 SYRK(rank-k 更新)、 稀疏对称存储…

吹泡泡o 2024-11-28 02:02:49 1 0

如何确保 numpy BLAS 库可用作动态加载库?

theano 安装文档 声明,theano 将默认使用 numpy 中的 BLAS 库,如果“BLAS 库可作为动态加载库”。这似乎不适用于我的机器,请参阅错误消息。 我如何…

独享拥抱 2024-11-25 19:06:19 3 0

BLAS 向量乘法catlas_saxpby 无法正常工作

我试图有两个任意长度的向量(典型长度为 2048)并逐个元素相乘。因此对于所有 n,Z[n] = X[n] * Y[n]。 我设置来测试的代码相当基本: float inputX[…

一枫情书 2024-11-18 08:45:44 1 0

uBLAS 慢速矩阵稀疏向量乘法

我正在转换一些我自己的矢量代数代码以使用优化的 boost uBLAS 库。然而,当我尝试进行 SymmetricMatrix-SparseVector 乘法时,我发现它比我自己的实…

所谓喜欢 2024-11-15 10:46:29 4 0

从 2D NSArray 创建 C 数组

我有一个 2D NSArray 字符串数字,我想将其转换为 2D C 双精度数组,以便与 BLAS/LAPACK 函数一起使用(通过加速框架)。 这行代码似乎可以工作,但是…

隐诗 2024-11-15 08:33:42 3 0
更多

推荐作者

已经忘了多久

文章 0 评论 0

15867725375

文章 0 评论 0

LonelySnow

文章 0 评论 0

走过海棠暮

文章 0 评论 0

轻许诺言

文章 0 评论 0

信馬由缰

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文