潜在语义索引
我试图找出如何对 LSI 中 SVD 实现后产生的矩阵进行乘法。我的研究需要这个。我想进行文档聚类。
I'm trying to find out how to carry out the multiplication of the matrices produced after SVD implementation in LSI. I need this for my research. I want to carry out document clustering.
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(1)
根据我的阅读,一旦您使用 SVD 分解术语文档矩阵来创建 [U, S, V],您需要将奇异值 S 与左因子矩阵 V' 相乘。 V' 是文档空间矩阵,按奇异值缩放。结果矩阵的行的余弦相似度应该为您提供文档相似度。
From what I've read, once you decompose the term-document matrix with the SVD to create [U, S, V], you need to multiple the singular values, S, with the left factor matrix, V'. V' is your document-space matrix, which is scaled by the singular values. The cosine similarity of the rows of the resulting matrix should give you document similarities.