如何在Windows环境下使用Mahout？

发布于 2024-08-31 02:13:13 字数 314 浏览 8 评论 0原文

我正在尝试在 Windows 上运行的应用程序中使用 Mahout。我想使用 k-means 从 lucene 索引构建集群。

一旦我必须创建序列文件（从 lucene 索引创建向量），我就会收到 Hadoop 异常，因为 Hadoop 对 Windows 环境中未知的程序进行命令行调用（例如 chmod）。在 Cygwin 中运行不是一个选项，因为我希望能够从 eclipse 运行该应用程序。

所以我的问题是

有没有办法避免创建序列文件来从 lucene 索引检索向量？

或者有没有办法在 Windows 环境中创建序列文件？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

梦里梦着梦中梦 2024-09-07 02:13:13

在 Windows 环境中运行 Hadoop 的唯一方法是安装 Cygwin。有关详细信息，请参阅此博客文章：

http://hayesdavis。 net/2008/06/14/running-hadoop-on-windows/

Cygwin 将提供 Hadoop 依赖的所有命令行实用程序（如 chmod）。如果需要，您仍然可以从 Eclipse 中运行 Hadoop 作业。

回复收藏 0 原文

羁绊已千年 2024-09-07 02:13:13

您知道 SequenceFile API 吗？看看这里： http:// /hadoop.apache.org/common/docs/current/api/org/apache/hadoop/io/SequenceFile.html
您可以尝试自己写入/读取数据。

我认为你可以在 Windows 中以独立模式从 eclipse 运行 Mahout。但你会出现一些缺点和障碍。你应该尝试一下你能走多远。

在我看来，你不应该坚持从 Eclipse 运行 mahout。 ;-)

回复收藏 0 原文

跨年 2024-09-07 02:13:13

您可以使用虚拟机来运行 Hadoop 环境。
对我来说，最好的解决方案是使用 http://hortonworks.com/ 项目。
一切都很顺利。

回复收藏 0 原文

~没有更多了~

关于作者

深陷

暂无简介

文章

27 人气

关注发私信

Promise

文章 0 评论 0

关注

qq_lbRlsh

文章 0 评论 0

关注

待＂谢繁草

文章 0 评论 0

关注

yy2010hell

文章 0 评论 0

关注

漫无边际

文章 0 评论 0

关注

傲娇萝莉攻

文章 0 评论 0

友情链接

文江博客

如何在Windows环境下使用Mahout？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签