我在 100 维空间中有 2,000,000 个点。如何将它们聚类为 K(例如 1000)个簇?
问题来了如下。我有 M 个图像,并为每个图像提取 N 个特征,每个特征的维度为 L。因此,我有 M*N 个特征(对于我的情况为 2,000,000),每个特征具有 …
使用带有 L 方法的平滑器来确定 K 均值聚类的数量
在应用 L 方法来确定数据集中 k 均值簇的数量之前,是否有人尝试过对评估指标应用平滑器?如果是这样,它是否改善了结果?或者允许更少数量的 k 均值…
python:如何将列表合并为簇?
我有一个元组列表: [(3,4), (18,27), (4,14)] 并且需要一个代码合并具有重复数字的元组,制作另一个列表,其中所有列表元素仅包含唯一数字。该列表应…
Google 地图高级聚类
www.fastfoodmaps.com http://maps.forum.nu/server_side_clusterer/ 我正在寻找带有聚类的多色标记,如上面网站的示例。 我找到了具有聚类概念的单色…
如何可视化基因网络和基因聚类组?
我正在处理生物数据——即基因组。例如: group 1: geneA geneB geneC group 2: geneD geneE group 3: geneF geneG geneH 对于每对基因,geneX 和 gen…
在 MATLAB 中对文本进行聚类
我想在 MATLAB 中对文本进行层次凝聚聚类。比如说,我有四个句子, I have a pen. I have a paper. I have a pencil. I have a cat. 我想对上面的四个…
关于非 ACID(分布式)系统的精彩文章/视频/...? (“最终一致”等)
Closed. This question is seeking recommendations for software libraries, tutorials, tools, books, or other off-site resources. It does not …
相似文本数据的概率聚类技术?
我在各种文档上有 20,000 个公司地址,这些地址的格式都不同。例如: A公司 12345街 美国 CompanyA, Inc 街 12345 号 2 号盒子 美国华盛顿州 The Comp…
计算 Lucene 文档之间的相似度和质心
为了对从 Lucene 获得的结果执行简单的聚类算法,我必须计算 Lucene 中两个文档之间的余弦相似度,我还需要能够制作一个质心文档来表示每个聚类的质心…