在 WIndows 上使用 Lucene 进行集群 Mahout
我是 Mahout 和 Lucene 的新手。我查看了每个论坛和提出的问题,但我还无法理解一些事情。我已经用 TermVectors 完成了 Lucene 索引。但是我需要使用 …
Mahout K-means 聚类给我的结果是 0 属于聚类 1.0: []
我针对一组序列文件运行了 K 均值聚类算法。然而,生成的结果如下所示: 0 属于集群 1.0: [] 0 属于集群 1.0: [] 0 属于集群 1.0: [] 0 属于集群 1.0:…
在 Mahout 上安装 grouplens 数据时出现问题
通过链接安装mahout的任务(http://girlincomputerscience.blogspot.com /2010/11/apache-mahout.html) 在将 liberary 复制到 task-web 文件夹的过程…
使用“SequenceFilesFromDirectory”的问题在我的代码中
我正在尝试编写一个示例程序,它可以调用“SequenceFilesFromDirectory”的主要方法,该方法旨在将一组文件转换为序列文件格式。 public class TestSe…
如何理解这段代码片段的错误消息?
我需要使用开源软件 Mahout 开展一个项目。示例程序 如下。 import org.apache.mahout.cf.taste.common.Refreshable; import org.apache.mahout.cf.ta…
HBase& Mahout - 使用 HBase 作为 Mahout 的数据存储/源 - 分类
我正在开发一个大型文本分类项目,我们将文本数据(简单消息)存储在 HBase 中。 我们有两个问题,首先我们想使用 HBase 作为 Mahout 分类器(即拜耳…
在实践中,您需要多少台机器才能让 Hadoop / MapReduce / Mahout 加速可并行化的计算?
我需要进行一些繁重的机器学习计算。我在局域网上有少量空闲的机器。我需要多少台机器才能使用 hadoop / mapreduce / mahout 分布式计算,以便比在没…
是什么导致了类似“”的错误构造函数未定义”
我正在尝试在 Eclipse 中编译“Mahout in Action”的示例代码。有一个名为“LimitedMemoryDiffStorage.java”的 java 文件。本质上只是定义一个类 cla…
关于“将 Mahout 的 Maven 项目转换为 Eclipse 项目”的问题
在安装Mahout等开源软件时,我读了一些注释,例如 将Mahout的Maven项目转换为Eclipse项目, 这是什么意思? Maven 项目和 Eclipse 项目有什么区别?…
与 slf4j 库相关的编译问题
我正在尝试编译一个开源库,并遇到以下问题。当我保留slf4j-jcl-1.6.0.jar和slf4j-api-1.6.0.jar这两个库时,eclipse编译器会给我以下错误消息: SLF4…
具有非常大矩阵的 K 均值
我必须在一个非常大的矩阵(大约 300.000x100.000 个值,超过 100Gb)上执行 k 均值聚类。我想知道我是否可以使用 R 软件或 weka 来执行此操作。 我的…
如何追溯这个编译错误?
我正在通过从书中复制的示例开始学习使用 mahout。然而,Eclipse 编译器给了我以下消息: > Exception in thread "main" java.lang.NoClassDefFoundEr…