当前位置：文江博客话题详情

潜在语义索引 (LSI) 是统计分类算法吗？

发布于 2024-08-08 22:56:29 字数 220 浏览 10 评论 0原文

潜在语义索引 (LSI) 是统计分类算法吗？为什么或为什么不呢？

基本上，我试图弄清楚为什么统计分类的维基百科页面没有提到LSI 。我刚刚开始研究这个东西，我正在尝试了解所有不同的对事物进行分类的方法是如何相互关联的。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

输什么也不输骨气 2024-08-15 22:56:29

不，它们并不完全相同。统计分类的目的是尽可能干净地将项目分成不同的类别，例如，明确决定项目 X 是否更像 A 组或 B 组中的项目。

LSI 旨在显示项目相似或不同的程度，主要是查找与指定项目显示相似程度的项目。虽然这相似，但并不完全相同。

回复收藏 0 原文

一曲爱恨情仇 2024-08-15 22:56:29

LSI/LSA最终是一种降维技术，通常与最近邻算法相结合，使其成为分类系统。因此，它本身只是使用 SVD 在较低维度“索引”数据的一种方法。

回复收藏 0 原文

甲如呢乙后呢 2024-08-15 22:56:29

您是否阅读过维基百科上的 LSI ？它说它使用矩阵分解（SVD），而矩阵分解有时又用于分类。

回复收藏 0 原文

蓝天 2024-08-15 22:56:29

机器学习的主要区别在于“监督”建模和“无监督”建模。

通常“统计分类”一词指的是监督模型，但并非总是如此。

使用监督方法，训练集包含一个“真实情况”标签，您可以构建模型进行预测。当您评估模型时，目标是预测真实标签的最佳猜测（或概率分布），而您在评估时不会有这种情况。通常有一个性能指标，并且非常清楚什么是正确答案，什么是错误答案。

无监督分类方法试图将大量可能以复杂方式变化的数据点聚类为较少数量的“相似”类别。每个类别中的数据应该在某种“有趣”或“深刻”方面相似。由于没有“基本事实”，您无法评估“对或错”，但“更多”与“更少”有趣或有用。

类似地，在评估时间，您可以将新示例放入潜在的集群之一（清晰分类），或者给出某种权重来量化集群“原型”的相似或不同程度。

因此，在某些方面，监督模型和无监督模型可以产生“预测”，即类/簇标签的预测，但它们本质上是不同的。

通常，无监督模型的目标是为后续监督模型提供更智能、更强大的紧凑输入。

回复收藏 0 原文

~没有更多了~

关于作者

稚然

暂无简介

0 文章

0 评论

23 人气

关注发私信

友情链接

文江博客

潜在语义索引 (LSI) 是统计分类算法吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

马化腾

thousandcents

辰『辰』

ailin001

再摆5分钟就干活

冷情妓

友情链接

潜在语义索引 (LSI) 是统计分类算法吗？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签

推荐作者

马化腾

thousandcents

辰『辰』

ailin001

再摆5分钟就干活

冷情妓

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。