如何使用 CUDA 为块 lanczos 算法乘以稀疏矩阵(在 gf(2) 字段上)?
我有一个与块 lanczos 算法(Montengro 版本)相关的学术项目要做。我在设计用于实现块 lanczos 的算法时遇到问题,任何人都可以建议我应该采取什么路径来使该算法中出现的稀疏矩阵相乘。它们可以很大,大约 1M X 1M。我有 gt 330m cuda 支持的 GPU。
I have an Academic project to do which relates to block lanczos algorith (Montengro's version). I have a problem designing the algorithm for the implementation of block lanczos, can anyone suggest me what path should I take for the sparse matrices that arise in this algo to multiply. They can be large ranging around 1M X 1M. I have gt 330m cuda enabled gpu with me.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您是否看过CUSPARSE(包含在CUDA 工具包)和/或 CUSP(开源)?
Have you looked at CUSPARSE (included with the CUDA Toolkit) and/or CUSP (open source)?