返回向量空间模型中表示的相似文档的算法
我有一个包含大约 30,000 个文档的 tf-idf 向量的数据库。 我想为给定的文档返回一组类似的文档 - 大约 4 个左右。 我考虑过在数据上实现 K-Means(聚…
具有非常大矩阵的 K 均值
我必须在一个非常大的矩阵(大约 300.000x100.000 个值,超过 100Gb)上执行 k 均值聚类。我想知道我是否可以使用 R 软件或 weka 来执行此操作。 我的…
如何用Java编写GMM(高斯混合模型)?
如何用 Java 编写 GMM(高斯混合模型)? MATLAB 中有一些实现,但我正在寻找一些有关它的文档和 Java 中的示例代码。 PS:如果可能的话,我如何在我…
如何实现MFCC特征的K-Means聚类算法?
我用MFCC算法得到了一些声音变量的特征。我想用 K-Means 对它们进行聚类。我有 70 帧,每一帧都有一个语音样本的 9 个倒谱系数。这意味着我有一个类似…
选择标签云的字体大小 (rails3)
我想根据评级设置标签的字体大小。这就是我的样本评级: 206 82 25 24 25 19 8 5 0 3 2 1 6 1 1 0 32 6 3 -1 112 31 6 8 2 24 18 2 2 1 1 1 2 6 67 35…
在postgis中有效查询定位簇的质心?
我有一个实体 E 的空间分布式集合,在 PostGis 数据库中存储并进行空间索引。 每个实体都有许多索引的非空间属性,例如 TYPE、VALUE 等。 是否有针对…