返回向量空间模型中表示的相似文档的算法
我有一个包含大约 30,000 个文档的 tf-idf 向量的数据库。 我想为给定的文档返回一组类似的文档 - 大约 4 个左右。 我考虑过在数据上实现 K-Means(聚…
具有非常大矩阵的 K 均值
我必须在一个非常大的矩阵(大约 300.000x100.000 个值,超过 100Gb)上执行 k 均值聚类。我想知道我是否可以使用 R 软件或 weka 来执行此操作。 我的…
如何实现MFCC特征的K-Means聚类算法?
我用MFCC算法得到了一些声音变量的特征。我想用 K-Means 对它们进行聚类。我有 70 帧,每一帧都有一个语音样本的 9 个倒谱系数。这意味着我有一个类似…
在 OpenCV 中实现词汇树
我正在尝试基于论文“Scalable Recognition with a Vocabulary Tree”来实现图像搜索。我正在使用 SURF 来提取特征和关键点。例如,对于一张图像,我…