使用“SequenceFilesFromDirectory”的问题在我的代码中

发布于 2024-11-28 09:44:34 字数 976 浏览 4 评论 0原文

我正在尝试编写一个示例程序,它可以调用“SequenceFilesFromDirectory”的主要方法,该方法旨在将一组文件转换为序列文件格式。

public class TestSequenceFileConverter {
public static void main(String args[]){   
String inputDir = "inputDir";   
String outputDir = "outoutDir";
SequenceFilesFromDirectory.main(new String[] {"--input",
        inputDir.toString(), "--output", outputDir.toString(), "--chunkSize",
        "64", "--charset",Charsets.UTF_8.name()});
}
}

但是 Eclipse 告诉我我所做的事情是错误的,并出现以下错误消息

该行有多个标记 - 标记“main”上的语法错误,= 在此之后预期 代币 - 标记语法错误、构造错误 - SequenceFilesFromDirectory 无法解析

我想我没有正确使用此方法,但我不知道如何修复它?多谢。

以下是 SequenceFilesFromDirectory 的定义方式。 SequenceFilesFromDirectory 的 API 链接是 http://search -lucene.com/jd/mahout/utils/org/apache/mahout/text/SequenceFilesFromDirectory.html

I am trying to write a sample program that can call use the main method of "SequenceFilesFromDirectory", which aims to convert a set of files into sequence file format.

public class TestSequenceFileConverter {
public static void main(String args[]){   
String inputDir = "inputDir";   
String outputDir = "outoutDir";
SequenceFilesFromDirectory.main(new String[] {"--input",
        inputDir.toString(), "--output", outputDir.toString(), "--chunkSize",
        "64", "--charset",Charsets.UTF_8.name()});
}
}

But the Eclipse tells me that what I did was wrong with the following error message

Multiple markers at this line
- Syntax error on token "main", = expected after this
token
- Syntax error on token(s), misplaced construct(s)
- SequenceFilesFromDirectory cannot be resolved

I think I did not use this method correctly, but I don't know how to fix it? Thanks a lot.

The following is how the SequenceFilesFromDirectory defines. The API link for SequenceFilesFromDirectory is http://search-lucene.com/jd/mahout/utils/org/apache/mahout/text/SequenceFilesFromDirectory.html

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

流星番茄 2024-12-05 09:44:34

我的猜测是您缺少文件第一部分中的导入行:

import org.apache.mahout.text.SequenceFilesFromDirectory;

My guess is that you're missing an import line from the first section of your file:

import org.apache.mahout.text.SequenceFilesFromDirectory;
两相知 2024-12-05 09:44:34

我认为您使用 SequenceFilesFromDirectory 的目的是将 doc 文件转换为序列文件。如果是这样,最好在创建SequenceFilesFromDirectory的对象之后调用run()/runSequential()/runMapReduce()方法,因为SequenceFilesFromDirectory.main()内部会调用haddop ToolRunner.run()方法进行处理。
而 SequenceFilesFromDirectory 的 run 方法执行实际处理。

I think your purpose for using SequenceFilesFromDirectory is to convert doc files to sequence files. If so, better to call the run()/runSequential()/runMapReduce() methods ater creating an object of SequenceFilesFromDirectory, because SequenceFilesFromDirectory.main() internally calls haddop ToolRunner.run() method for processing.
Whereas the run methods of SequenceFilesFromDirectory do the actual processings.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文