当前位置：文江博客话题详情

如何在 500,000 个点的 100 维空间中找到最近的 2 个点？

发布于 2024-09-27 11:03:08 字数 105 浏览 12 评论 0原文

我有一个 100 维空间中包含 500,000 个点的数据库，我想找到最接近的 2 个点。我该怎么做？

更新：空间是欧几里得的，抱歉。并感谢所有的答案。顺便说一句，这不是家庭作业。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

亚希 2024-10-04 11:03:08

算法简介中有一章致力于在 O( 中查找二维空间中两个最近的点n*logn) 时间。您可以在 Google 图书。事实上，我建议每个人都这样做，因为他们应用分而治之技术来解决这个问题的方式非常简单、优雅且令人印象深刻。

尽管它不能直接扩展到您的问题（因为常量 7 将替换为 2^101 - 1），但它对于大多数数据集来说应该没问题。因此，如果您有相当随机的输入，它将为您提供 O(n*logn*m) 复杂度，其中 n 是点数，m code> 是维数。

编辑
这都是假设你有欧几里得空间。即向量v的长度为sqrt(v0^2 + v1^2 + v2^2 + ...)。但是，如果您可以选择指标，则可能还有其他选项来优化算法。

回复收藏 0 原文

瘫痪情歌 2024-10-04 11:03:08

使用kd树。您正在研究最近邻问题，并且有高度优化的数据结构来处理此类问题。

http://en.wikipedia.org/wiki/Kd-tree

PS 有趣的问题！

回复收藏 0 原文

浪菊怪哟 2024-10-04 11:03:08

您可以尝试 ANN 库，但这只能提供最多 20 个维度的可靠结果。

回复收藏 0 原文

ぃ双果 2024-10-04 11:03:08

对数据运行 PCA，将向量从 100 维转换为 20 维。然后创建一棵 K 最近邻树（KD-Tree）并根据欧几里德距离获取最近的 2 个邻居。

一般如果没有。维度非常大，那么您必须采用强力方法（并行+分布式/映射缩减）或基于聚类的方法。

回复收藏 0 原文

很酷又爱笑 2024-10-04 11:03:08

使用称为 KD-TREE 的数据结构。您需要分配大量内存，但您可能会根据数据发现一两个优化。

http://en.wikipedia.org/wiki/Kd-tree。

我的朋友几年前在写博士论文时遇到了类似的问题。他的工作在 10 个维度上有 100 万个点。我们构建了一个kd-tree库来解决这个问题。如果您想离线联系我们，我们也许可以挖掘代码。

这是他发表的论文：
http://www.elec.qmul.ac.uk /people/josh/documents/ReissSelbieSandler-WIAMIS2003.pdf

回复收藏 0 原文

~没有更多了~

关于作者

绳情

暂无简介

文章

27 人气

关注发私信

友情链接

文江博客

如何在 500,000 个点的 100 维空间中找到最近的 2 个点？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如何在 500,000 个点的 100 维空间中找到最近的 2 个点？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（5）

关于作者

相关话题

热门标签

推荐作者

十二

飞烟轻若梦

OPleyuhuo

wxb0109

旧城空念

-小熊_

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。