求解最近邻的最佳性能关键算法

发布于 2024-08-09 17:19:37 字数 553 浏览 13 评论 0原文

我们有一个 x,y 对的列表。每对代表二维空间上的一个点。我想从这个列表中找到距离特定点 xq,yq 最近的点。对于这个问题，最好的性能关键算法是什么？ Lisp of point 不会改变；这意味着我不需要执行插入和删除。我只想找到该集合中目标 xq,yq 点的最近邻居。

编辑1：谢谢大家！正如 Stephan202 猜对的那样，我想重复执行此操作；就像一个函数。列表不一定是排序的（事实上我不明白它是如何排序的？就像一个主键为 2 列 a 和 y 的表？如果有帮助，那么我会对它进行排序）。

我将根据列表构建一次数据结构，然后我将在函数中使用此生成的数据结构（如果此过程本身相关）。

谢谢雅各布；看起来 KD-Tree 数据结构是一个很好的候选答案（我也这么认为。当我得到一些相关结果时我会更新）。

编辑2：我发现，这个问题被命名为“最近邻居”！

编辑3：第一个标题是“搜索算法（用于空间查询和空间索引）（最近邻）”；我选择了一个新标题：“求解最近邻的最佳性能关键算法”。因为我不想对我的初始数据执行插入和删除操作，并且我只想从它们到新点（不会插入）最近的一个，所以我选择（当前）研究 KD 树。感谢大家！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

看海 2024-08-16 17:19:37

正如 Stephan202 所指出的，如果您计划查找多个点的最接近匹配，则应该使用一棵树。

我会推荐一个 KD 树，它的实现可以在 OpenCV 2.0 等多个包中轻松找到。或者您可以自己实现一个！

编辑：我在这里问了一个关于kd-tree实现的问题 - 可能有用的。

编辑： KD 树已广泛成功地用于 NN 搜索:) - 另外，如果您愿意接受近似匹配，您可以使用近似最近邻的快速库 (FLANN)。 FLANN 实现存在于 OpenCV 2.0 中。

如果您不需要近似答案，您可以调整 FLANN 参数来搜索整个树。

回复收藏 0 原文

如何视而不见 2024-08-16 17:19:37

如果查询点 (xq, yq) 发生变化而列表没有变化，则需要计算 点列表的 Voronoi 图。这将为您提供一组多边形或“单元”（其中一些是无限的）；每个多边形对应于原始列表中的一个点，称为该单元的“站点”。完全位于一个多边形内部的任何点都比原始列表上的其他站点更接近该多边形的站点。两个多边形之间边界上的任何点与每个站点的距离相等。

一旦您了解了这一步，您就需要一种简单的方法来确定您所在的多边形。这称为 点位置问题。

关于此类事情的一本非常非常好的书是计算几何：算法和应用。他们详细讨论了 Voronoi 图计算和点定位的梯形板方法。

如果您不想自己编写代码，也不应该这样做，那么尝试获取像这样的库CGAL 将为您完成大部分工作。这可能也适用于 KD 树答案，但我具体不知道。

回复收藏 0 原文

是伱的 2024-08-16 17:19:37

您需要一个空间索引。

如果你自己推出，你会比选择 R-Tree 或四叉树算法。

回复收藏 0 原文

清醇 2024-08-16 17:19:37

我会选择四叉树。这是最简单的空间结构。在二维中，我通常会推荐四叉树而不是 kd 树，因为它更简单、更快。它的缺点是，如果维度数较高，则消耗更多内存，但如果维度数较多，则差异并不显着。

如果您的坐标是浮点类型，那么有一个很好的优化技巧：
在查询中，您首先必须找到包含所询问的最近点的点的叶节点。为此，您必须从根到叶遍历树 - 在每次迭代中决定要踩到哪个子节点。
将子节点的标识符/地址存储在 Node 结构中的 4 大小的数组中。将查询算法中的点坐标数字化。然后，您只需通过数字化点坐标的 2 个正确位对数组进行索引即可找到正确的子节点。数字化速度很快：用一个简单的 static_cast 来实现。

但首先实现四叉树而不进行优化，因为位操作很容易产生错误。即使没有这种优化，它仍然是最快的解决方案。

回复收藏 0 原文