k-means:每次执行的集群相同
是否有可能为特定数据集的每次执行获得相同的 kmeans 集群。就像随机值一样,我们可以使用固定种子。是否可以停止聚类的随机性?
Is it possible to get same kmeans clusters for every execution for a particular data set. Just like for a random value we can use a fixed seed. Is it possible to stop randomness for clustering?
如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。
绑定邮箱获取回复消息
由于您还没有绑定你的真实邮箱,如果其他用户或者作者回复了您的评论,将不能在第一时间通知您!
发布评论
评论(2)
是的。在进行聚类之前,使用
set.seed
设置随机值的种子。使用
kmeans
中的示例:测试相等性:
Yes. Use
set.seed
to set a seed for the random value before doing the clustering.Using the example in
kmeans
:Test for equality:
是的,在运行
kmeans(....)
之前立即调用set.seed(foo)
将给出相同的随机开始,因此每次都会给出相同的聚类。foo
是一个种子,如42
或其他一些数值。Yes, calling
set.seed(foo)
immediately prior to runningkmeans(....)
will give the same random start and hence the same clustering each time.foo
is a seed, like42
or some other numeric value.