当前位置：文江博客话题详情

Python algorithm cluster-analysis classification nearest-neighbor

聚类问题

发布于 2024-09-26 15:58:09 字数 171 浏览 6 评论 0原文

我的任务是找到包含特定数据集最多点的 N 个聚类，前提是这些聚类受特定大小的限制。目前，我正在尝试通过将数据插入 kd 树、迭代数据并找到其最近邻居来实现此目的，然后在它们生成的簇不超过限制的情况下合并这些点。我不确定这种方法会给我一个全局解决方案，所以我正在寻找调整它的方法。如果您能告诉我这会属于什么类型的问题，那就太好了。

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（3）

嘿看小鸭子会跑 2024-10-03 15:58:09

首先查看 scipy.clustering。关键词搜索可以提供有关所使用的不同算法的大量信息。集群是一个很大的领域，有大量的研究和实际应用，并且有许多简单的方法已被发现效果相当好，因此您可能不想从自己开始。

也就是说，聚类算法通常相当容易编程，如果您确实想自己编程，k 均值和凝聚聚类是最喜欢的快速实现方法。

最后，我不确定你关于由一定大小限制的 N 个簇的想法是否是自洽的，但这取决于你所说的“大小”和“簇”的确切含义（单个点是一个簇吗？）。

更新：

根据下面OP的评论，我认为标准聚类方法不会给出这个问题的最佳解决方案，因为没有可以优化的点之间“距离”的连续度量。尽管在某些情况下它们可能会给出很好的解决方案或近似值。对于聚类方法，我会尝试 k-means，因为该方法的前提是具有固定的 N。

但是，这看起来更像是覆盖问题（即，你有 N 个固定大小的矩形，并且你试图用它们覆盖所有的点），但我不'对这些不太了解，所以我将其留给其他人。

回复收藏 0 原文

甜尕妞 2024-10-03 15:58:09

如果您的簇数是固定的，并且您只想最大化这些簇中的点数，那么我认为贪婪的解决方案会很好：

找到可以包含最大点数的矩形，
删除这些点，
找到下一个矩形
...

那么如何找到包含最多点数的最大面积A的矩形（实际上每个矩形都会有这个面积）？

矩形对于欧几里德距离来说并不常见，在尝试解决这个问题之前，您能否精确确定您是否真的需要矩形或只是对簇大小进行一些限制？圆形/椭圆形可以吗？

编辑：
贪婪是行不通的（见下面的评论），它确实需要是矩形......

回复收藏 0 原文

夢归不見 2024-10-03 15:58:09

链接文本实际上，我认为这是有两个关键假设确实很容易。

1) 假设“一定大小”，我们可以说“任何簇必须完全包含在半径为 r 的圆内”。

2) 您的所有点都是簇中心的候选“种子”点。

首先计算所有点之间所有小于r的距离。现在仅使用小于 r 的可行边来解决集合覆盖问题。如果任何点的最近邻距离大于 r 距离，则它会形成自己的簇。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

0 文章

0 评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

亚希

文章 0 评论 0

cyp

文章 0 评论 0

北漠

文章 0 评论 0

11223456

文章 0 评论 0

坠似风落

文章 0 评论 0

游魂

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文