k-means会陷入无限循环吗?

发布于 2024-09-30 21:15:54 字数 117 浏览 7 评论 0原文

我研究过 k 均值算法并且知道它是如何工作的。

只是好奇,是否有任何情况该算法会进入无限循环,比如说我们对初始质心点有一些特别糟糕的选择?我只能想象 k 均值会在初始选择错误的情况下达到局部最小值的情况。

I've studied the k-means algorithm and I know how it works.

Just curious,is there any situation that this algorithm will go into an infinite loop,say if we have some particular bad choices for initial centroid points? I could only imagine a situation k-means will get to local minimum with bad initial choices.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

眉黛浅 2024-10-07 21:15:54

否。k 均值在 d 维空间中的上限为 O(nkd)

No. k-means has an upper bound of O(nkd) in d-dimensional space.

爱*していゐ 2024-10-07 21:15:54

另请考虑同一问题的这个答案。
https://stackoverflow.com/a/60312554/15467861

最后一种边缘情况:如果多个最小状态具有相同的损失怎么办?这是一种极不可能发生的情况,但当且仅当算法对于平局断路器的编码很差时才可能导致问题。本质上,这可能导致循环的唯一方法是,数据点对于两个簇的距离相等,并且即使距离相等,也允许将簇更改为远离当前的簇。可以说,算法通常经过编码,以便数据点永远不会在平局上或以其他确定性方式交换,从而完全避免这种情况。

Consider also this answer to the same question.
https://stackoverflow.com/a/60312554/15467861

The last edge case: What if more than one minimum state has equal loss? This is a highly unlikely scenario, but can cause issues if and only if the algorithm is coded poorly for tie breakers. Essentially, the only way this can cause a cycle is if a data point has equal distance for two clusters, and is allowed to change clusters away from it's current cluster even on equal distance. Suffice to say, the algorithms are generally coded so that the data points never swap on a tie, or in some other deterministic manner, thus avoiding this scenario entirely.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文