最近邻的一些快速近似有哪些？

发布于 2024-10-18 07:57:26 字数 183 浏览 6 评论 0原文

假设我有一个巨大的（几百万）n 个向量列表，给定一个新向量，我需要从集合中找到一个非常接近的向量，但它不需要是最接近的。（最近邻找到最接近的并运行 n 次）

有哪些算法可以非常快速地逼近最近邻，但牺牲了准确性？

编辑：因为它可能会有所帮助，所以我应该提到数据在大多数情况下都非常平滑，在随机维度上出现尖峰的可能性很小。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

没有你我更好 2024-10-25 07:57:26

存在比 O(n) 更快的算法来通过任意距离搜索最近的元素。有关详细信息，请查看 http://en.wikipedia.org/wiki/Kd-tree。

回复收藏 0 原文

戒ㄋ 2024-10-25 07:57:26

如果您使用高维向量，例如 SIFT 或 SURF 或多媒体领域使用的任何描述符，我建议您考虑 LSH。

魏东的博士论文 (http://www.cs.princeton.edu/ cass/papers/cikm08.pdf）可能会帮助您找到KNN搜索的更新算法，即LSH。与更传统的 LSH 不同，例如 E2LSH (http://www.mit.edu/~andoni/LSH /）由麻省理工学院的研究人员早些时候发表，他的算法使用多重探测来更好地平衡召回率和成本之间的权衡。

回复收藏 0 原文