使用带有 L 方法的平滑器来确定 K 均值聚类的数量

发布于 2024-09-29 22:10:48 字数 578 浏览 8 评论 0原文

在应用 L 方法来确定数据集中 k 均值簇的数量之前，是否有人尝试过对评估指标应用平滑器？如果是这样，它是否改善了结果？或者允许更少数量的 k 均值试验，从而大幅提高速度？您使用哪种平滑算法/方法？

“L-方法”详细说明如下： 确定层次聚类/分割算法中的聚类/分段数量 ，萨尔瓦多和Chan

这计算一系列不同试验簇计数的评估指标。然后，为了找到拐点（出现最佳数量的簇），使用线性回归拟合两条线。应用一个简单的迭代过程来改善膝部拟合 - 这使用现有的评估指标计算，并且不需要重新运行 k 均值。

对于评估指标，我使用简化版邓斯指数的倒数。简化速度（基本上我的直径和簇间计算被简化）。倒数使指数朝着正确的方向运行（即通常越低越好）。

K 均值是一种随机算法，因此通常会运行多次并选择最佳拟合。这工作得很好，但是当你对 1..N 个集群执行此操作时，时间很快就会增加。因此，控制运行次数符合我的利益。总体处理时间可能决定我的实现是否实用 - 如果我无法加快速度，我可能会放弃此功能。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

淡看悲欢离合 2024-10-06 22:10:48

我过去曾在这里问过一个类似问题就这样。我的问题是想出一个一致的方法来找到你所描述的 L 形的膝盖。所讨论的曲线代表了模型的复杂性和拟合度之间的权衡。

最佳解决方案是找到最大距离 d 的点如图所示：

alt text

注意：我还没有尚未阅读您链接到的论文..

回复收藏 0 原文

~没有更多了~

关于作者

腹黑女流氓

暂无简介

文章

28 人气

关注发私信

友情链接

文江博客

使用带有 L 方法的平滑器来确定 K 均值聚类的数量

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

佚名

今天

゛时过境迁

达拉崩吧

呆萌少年

孤者何惧

友情链接

使用带有 L 方法的平滑器来确定 K 均值聚类的数量

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

佚名

今天

゛时过境迁

达拉崩吧

呆萌少年

孤者何惧

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。