当前位置：文江博客话题详情

在 python/R 中使用稀疏矩阵的优点和缺点？

发布于 2024-11-02 11:50:55 字数 191 浏览 0 评论 0原文

我正在 python 中处理大型稀疏矩阵（从文本生成的文档特征矩阵）。仔细研究这些需要花费相当多的处理时间和内存，我想稀疏矩阵可以提供一些改进。但我担心使用稀疏矩阵库会让插入其他 python（以及 R，通过 rpy2）模块变得更加困难。

走过这座桥的人可以提供一些建议吗？在 python/R 中使用稀疏矩阵在性能、可扩展性和兼容性方面有哪些优缺点？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

ぽ尐不点ル 2024-11-09 11:50:55

在 Python 中使用稀疏矩阵本身可能并不是一个好主意。
您是否检查过 numpy / scipy 中的稀疏矩阵？

Numpy 带来了主要使用 C 代码来在 Python 中提供性能提升的巨大好处。

根据我在 R 中进行文本处理的有限经验，其性能使其几乎无法用于探索性数据分析之外的任何用途。

无论如何，您不应该对稀疏矩阵使用普通列表，（可以理解）需要一段时间来仔细研究它们。

回复收藏 0 原文

情归归情 2024-11-09 11:50:55

有多种方法可以表示稀疏矩阵（R SparseM 包的文档报告了 20 种不同的存储稀疏矩阵数据的方法），因此与所有解决方案的完全兼容性可能是不可能的。数字选项还表明，不存在万能的解决方案。

根据在这些矩阵上找到大量数字运算例程的位置（numpy 或 R），选择 numpy 稀疏矩阵或 R 的 SparseM（通过 rpy2）。

回复收藏 0 原文

~没有更多了~

关于作者

﹉夏雨初晴づ

暂无简介

0 文章

0 评论

21 人气

关注发私信

烙印

文章 0 评论 0

关注

singlesman

文章 0 评论 0

关注

给自己一个微笑

文章 0 评论 0

关注

独孤求败

文章 0 评论 0

关注

晨钟暮鼓

文章 0 评论 0

关注

我是自愿种绣球花的

文章 0 评论 0

友情链接

文江博客

在 python/R 中使用稀疏矩阵的优点和缺点？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者