当前位置：文江博客话题详情

python中的K最近邻

发布于 2024-10-30 17:41:56 字数 1536 浏览 8 评论 0原文

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

温馨耳语 2024-11-06 17:41:56

我认为你应该使用 scikit ann。

这里有一个关于最近邻的很好的教程。

根据文档：

ann 是 SWIG 生成的近似最近邻 (ANN) 库的 Python 包装器 ( http://www.cs.umd.edu/~mount/ANN/），由 David M. Mount 和 Sunil Arya 开发。 ann 提供了一个不可变的 kdtree 实现（通过 ANN），它可以执行 k 最近邻并近似 k

回复收藏 0 原文

月亮坠入山谷 2024-11-06 17:41:56

这是一个比较 scipy.spatial.cKDTree 和 pyflann.FLANN 的脚本。亲自看看哪一个对您的应用程序来说更快。

import cProfile
import numpy as np
import os
import pyflann
import scipy.spatial

# Config params
dim = 4
data_size = 1000
test_size = 1

# Generate data
np.random.seed(1)
dataset = np.random.rand(data_size, dim)
testset = np.random.rand(test_size, dim)

def test_pyflann_flann(num_reps):
    flann = pyflann.FLANN()
    for rep in range(num_reps):
        params = flann.build_index(dataset, target_precision=0.0, log_level='info')
        result = flann.nn_index(testset, 5, checks=params['checks'])

def test_scipy_spatial_kdtree(num_reps):
    flann = pyflann.FLANN()
    for rep in range(num_reps):
        kdtree = scipy.spatial.cKDTree(dataset, leafsize=10)
        result = kdtree.query(testset, 5)

num_reps = 1000
cProfile.run('test_pyflann_flann(num_reps); test_scipy_spatial_kdtree(num_reps)', 'out.prof')
os.system('runsnake out.prof')

Here is a script comparing scipy.spatial.cKDTree and pyflann.FLANN. See for yourself which one is faster for your application.

import cProfile
import numpy as np
import os
import pyflann
import scipy.spatial

# Config params
dim = 4
data_size = 1000
test_size = 1

# Generate data
np.random.seed(1)
dataset = np.random.rand(data_size, dim)
testset = np.random.rand(test_size, dim)

def test_pyflann_flann(num_reps):
    flann = pyflann.FLANN()
    for rep in range(num_reps):
        params = flann.build_index(dataset, target_precision=0.0, log_level='info')
        result = flann.nn_index(testset, 5, checks=params['checks'])

def test_scipy_spatial_kdtree(num_reps):
    flann = pyflann.FLANN()
    for rep in range(num_reps):
        kdtree = scipy.spatial.cKDTree(dataset, leafsize=10)
        result = kdtree.query(testset, 5)

num_reps = 1000
cProfile.run('test_pyflann_flann(num_reps); test_scipy_spatial_kdtree(num_reps)', 'out.prof')
os.system('runsnake out.prof')

回复收藏 0 原文

巾帼英雄 2024-11-06 17:41:56

scipy.spatial.cKDTree
快速且稳定。
有关使用它进行 NN 插值的示例，请参阅（咳咳）
反距离-weighted-idw-interpolation-with-python所以。

（如果你可以说“我在 3d 中有 1M 个点，并且想要 1k 个新点的 k=5 个最近邻”，
您可能会得到更好的答案或代码示例。
找到邻居后，您想对他们做什么？）

回复收藏 0 原文

很糊涂小朋友 2024-11-06 17:41:56

如果您想要采用 kd-tree 方法，它本身就在 scipy 中： http://docs.scipy.org/doc/scipy/reference/ generated/scipy.spatial.KDTree.html#scipy.spatial.KDTree

回复收藏 0 原文

~没有更多了~

关于作者

橙味迷妹

暂无简介

文章

27 人气

关注发私信

alipaysp_snBf0MSZIv

文章 0 评论 0

关注

梦断已成空

文章 0 评论 0

关注

瞎闹

文章 0 评论 0

关注

凯凯我们等你回来

文章 0 评论 0

关注

寄意

文章 0 评论 0

关注

似梦非梦

文章 0 评论 0

友情链接

文江博客

python中的K最近邻

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（4）

关于作者

相关话题

热门标签