当前位置：文江博客话题详情

URL nlp information-retrieval cluster-analysis

根据余弦相似度值进行聚类

发布于 2024-11-04 09:15:27 字数 201 浏览 5 评论 0原文

我从一组 URL 中提取了单词，并计算了每个 URL 内容之间的余弦相似度。而且我还标准化了 0-1 之间的值（使用最小-最大）。现在我需要根据余弦相似度值对 URL 进行聚类以查找找出类似的 URL。哪种聚类算法最合适？请建议我一种动态聚类方法，因为它会很有用，因为我可以按需增加 URL 的数量，而且它会更自然。如果您觉得我这样，请纠正我我正在制作以错误的方式取得进展。感谢您的期待。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

怪我入戏太深 2024-11-11 09:15:27

K-means聚类可以用于在线学习，你只需要先验选择聚类的数量。另外，我认为你不应该标准化你的数据，因为余弦已经提供了 [0:1] 范围内的值。您的最小-最大标准化可能会导致信息丢失。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

23 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

隔纱相望

文章 0 评论 0

昵称有卵用

文章 0 评论 0

梨涡

文章 0 评论 0

蓝咒

文章 0 评论 0

白芷

文章 0 评论 0

樱娆

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文