java中svd的问题
我已经经历过 jama 和 colt(我用 java 编写代码)。他们都希望我使用数组,使得行数大于列数。
但是对于潜在语义分析(LSA),我有 5 本书,总共有 1000 个奇怪的单词。当我使用术语文档矩阵时,我得到一个 5*1000 矩阵。
由于这不起作用,我被迫转置矩阵。在转置时我使用 1000 * 5 。当我执行 svd 时,使用 1000*5 得到一个 5*5 的 S 矩阵。为了进行降维,5*5 矩阵看起来很小。
可以做什么?
I have gone through jama and colt(I code in java) . Both of them expect me to use arrays such that the number of rows are more than the number of coloumns .
But in case of the Latent semantic analysis (LSA) i have 5 books and there are a total of 1000 odd words . When i use a term document matrix i get a 5*1000 matrix.
Since this does not work , i am forced to transpose the matrix . On transposing i use a 1000 * 5 . With a 1000*5 when i perform a svd i get a S matrix with 5*5 . To perform dimensionality reduction this the 5*5 matrix looks small .
What can be done ?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
您使用的文本段大小太大。文档(列)应该代表一页或几页文本,最多可能是一章。我也看到过使用段落大小。
The text segment size you are using is way too large. A document (column) should represent a page or few pages of text, perhaps a chapter at the largest. I have seen paragraph size used as well.