解释 mahout clusterdumper 的输出
我对爬行页面(超过 25K 文档;个人数据集)进行了聚类测试。 我已经完成了 clusterdump : $MAHOUT_HOME/bin/mahout clusterdump --seqFileDir outpu…
在R中,kmeans()和kmeansCBI()有什么区别?
我在数据集上尝试了 fps 包中的 kmeans() 和 kmeansCBI() 。 但是,他们给出了不同的 SSE 值,所以我不知道哪个是正确的值。 例如,对于 700*5 数据,…
R-“原理计算”只能与比变量更多的单位一起使用
我正在使用 R 软件(R Commander)对我的数据进行聚类。我的数据有一个较小的子集,包含 200 行和大约 800 列。尝试 kmeans 聚类并在图表上绘制时出现…
是否可以使用 scikit-learn K-Means Clustering 指定您自己的距离函数?
是否可以使用 scikit-learn K-Means Clustering 指定您自己的距离函数?…
如何实现 K-Means++算法?
我无法完全理解 K-Means++ 算法。我感兴趣的是如何选择第一个 k 质心,即初始化,其余部分就像原始 K-Means 算法。 使用的概率函数是基于距离还是高斯…
OpenCV 中的分层 k 均值无需了解“k”
我正在尝试对一组 4D 向量进行聚类,但事先不知道应该有多少个聚类。过去,在了解集群数量的情况下,我已经能够使用 cvKmeans2 进行集群。我在 API 中…
K 均值可用于帮助基于像素值的图像分离吗?
我正在尝试根据像素值分离灰度图像:假设一个 bin 中的像素为 0 到 60,另一个 bin 中的像素为 60-120,120-180 ...依此类推,直到 255。范围在此大致…
最相距的 k 个元素(聚类?)
我有一个简单的机器学习问题: 我有 n (~110) 个元素,以及所有成对距离的矩阵。我想选择相距最远的 10 个元素。也就是说,我想要 Maximize: Choose 1…
K均值聚类,为什么簇的初始位置不同会影响最终的聚类结果?
我不确定这个问题在这里是否合适。无论如何,这里的人似乎都很乐于助人。这是我的问题。 在 k 均值聚类的情况下,有必要给出聚类的初始位置。 为什么…
我们应该使用 k-means++而不是 k 均值?
k-means++ 算法有助于原始 k 的以下两点-means算法: 原始的k-means算法在输入大小上具有超多项式的最坏情况运行时间,而k-means++声称是O(log k)。 …