如何在 K - Means 算法中优化 K

发布于 2024-11-11 05:30:05 字数 260 浏览 3 评论 0原文

可能的重复:
使用 k-means 聚类时如何确定 k?

如果我不知道数据,我如何最初选择 K ?

有人可以帮我选择K吗?

谢谢 纳文

Possible Duplicate:
How do I determine k when using k-means clustering?

How can i choose the K initially, if i do not know about the data?

Can someone help me in choosing the K.

Thanks
Navin

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

苍风燃霜 2024-11-18 05:30:06

说真的,你想知道什么?您想让我们告诉您一些数字吗?或者如何找到最佳k的策略?您必须阅读有关 k-means 的书或其他资源,我很确定那里有相关内容。

维基百科上有关于它的内容:

http://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set

在使用算法之前,请先阅读它。

Seriously, what do you want to know? Do you want us to tell you some number? Or a strategy how to find the optimal k? You have to read a book or other resources about k-means, I'm pretty sure it is covered there.

There is something on Wikipedia about it:

http://en.wikipedia.org/wiki/Determining_the_number_of_clusters_in_a_data_set

Before you use an algorithm, read about it.

独孤求败 2024-11-18 05:30:05

基本思想是评估样本数据的聚类评分,通常是聚类内部的距离和聚类之间的距离。此测量值越多,聚类效果越好,基于此测量值,您可以选择最佳聚类参数。可以在此处找到其中一个指标 http://alias- i.com/lingpipe/docs/api/com/aliasi/cluster/ClusterScore.html

The base idea is to evaluate cluster scoring on sample data, usally it is distance inside cluster and distance between clusters. The more this measure the better clustering, based on this mesure you can select best clustring paramters. One of metrics can be found here http://alias-i.com/lingpipe/docs/api/com/aliasi/cluster/ClusterScore.html

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文