NumPy：向量化到一组点的距离总和

发布于 2024-12-23 01:54:20 字数 950 浏览 2 评论 0原文

我正在尝试实现 k-medoids 聚类算法在 Python/NumPy 中。作为该算法的一部分，我必须计算从对象到其“中心点”（簇代表）的距离总和。

我有：五个点上的距离矩阵、

n_samples = 5
D = np.array([[ 0.        ,  3.04959014,  4.74341649,  3.72424489,  6.70298441],
              [ 3.04959014,  0.        ,  5.38516481,  4.52216762,  6.16846821],
              [ 4.74341649,  5.38516481,  0.        ,  1.02469508,  8.23711114],
              [ 3.72424489,  4.52216762,  1.02469508,  0.        ,  7.69025357],
              [ 6.70298441,  6.16846821,  8.23711114,  7.69025357,  0.        ]])

一组初始中心点

medoids = np.array([0, 3])

和集群成员资格，

cl = np.array([0, 0, 1, 1, 0])

来计算所需的总和

>>> np.sum(D[i, medoids[cl[i]]] for i in xrange(n_samples))
10.777269622938899

我可以使用Python循环。我是否缺少某种用于计算这个总和的向量化习惯用法？

原文

I'm trying to implementing a k-medoids clustering algorithm in Python/NumPy. As part of this algo, I have to compute the sum of distances from objects to their "medoids" (cluster representatives).

I have: a distance matrix on five points

n_samples = 5
D = np.array([[ 0.        ,  3.04959014,  4.74341649,  3.72424489,  6.70298441],
              [ 3.04959014,  0.        ,  5.38516481,  4.52216762,  6.16846821],
              [ 4.74341649,  5.38516481,  0.        ,  1.02469508,  8.23711114],
              [ 3.72424489,  4.52216762,  1.02469508,  0.        ,  7.69025357],
              [ 6.70298441,  6.16846821,  8.23711114,  7.69025357,  0.        ]])

a set of initial medoids

medoids = np.array([0, 3])

and the cluster memberships

cl = np.array([0, 0, 1, 1, 0])

I can compute the required sum using

>>> np.sum(D[i, medoids[cl[i]]] for i in xrange(n_samples))
10.777269622938899

but that uses a Python loop. Am I missing some kind of vectorized idiom for computing this sum?

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

半透明的墙 2024-12-30 01:54:20

怎么样：

In [17]: D[np.arange(n_samples),medoids[cl]].sum()
Out[17]: 10.777269629999999

How about:

In [17]: D[np.arange(n_samples),medoids[cl]].sum()
Out[17]: 10.777269629999999

回复收藏 0 原文

~没有更多了~

关于作者

撑一把青伞

暂无简介

文章

26 人气

关注发私信

╰ゝ天使的微笑

文章 0 评论 0

关注

少女净妖师

文章 0 评论 0

关注

朱洁

文章 0 评论 0

关注

觉浅

文章 0 评论 0

关注

滥情空心

文章 0 评论 0

关注

hl1314520

文章 0 评论 0

友情链接

文江博客

NumPy：向量化到一组点的距离总和

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

╰ゝ天使的微笑

少女净妖师

朱洁

觉浅

滥情空心

hl1314520

友情链接

NumPy：向量化到一组点的距离总和

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（1）

关于作者

相关话题

热门标签

推荐作者

╰ゝ天使的微笑

少女净妖师

朱洁

觉浅

滥情空心

hl1314520

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。