java中svd的问题

发布于 2025-01-01 10:10:39 字数 251 浏览 1 评论 0原文

我已经经历过 jama 和 colt(我用 java 编写代码)。他们都希望我使用数组,使得行数大于列数。

但是对于潜在语义分析(LSA),我有 5 本书,总共有 1000 个奇怪的单词。当我使用术语文档矩阵时,我得到一个 5*1000 矩阵。

由于这不起作用,我被迫转置矩阵。在转置时我使用 1000 * 5 。当我执行 svd 时,使用 1000*5 得到一个 5*5 的 S 矩阵。为了进行降维,5*5 矩阵看起来很小。

可以做什么?

I have gone through jama and colt(I code in java) . Both of them expect me to use arrays such that the number of rows are more than the number of coloumns .

But in case of the Latent semantic analysis (LSA) i have 5 books and there are a total of 1000 odd words . When i use a term document matrix i get a 5*1000 matrix.

Since this does not work , i am forced to transpose the matrix . On transposing i use a 1000 * 5 . With a 1000*5 when i perform a svd i get a S matrix with 5*5 . To perform dimensionality reduction this the 5*5 matrix looks small .

What can be done ?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

风轻花落早 2025-01-08 10:10:39

您使用的文本段大小太大。文档(列)应该代表一页或几页文本,最多可能是一章。我也看到过使用段落大小。

The text segment size you are using is way too large. A document (column) should represent a page or few pages of text, perhaps a chapter at the largest. I have seen paragraph size used as well.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文