MapR 是否具有可扩展的机器学习算法。像马胡特一样?

发布于 2024-12-27 09:14:21 字数 46 浏览 1 评论 0原文

我特别想知道 MapR 是否有 Kmeans 聚类,就像 Mahout 一样?

I am specifically wondering if MapR has Kmeans clustering just like Mahout?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

始于初秋 2025-01-03 09:14:21

据我所知,MapR只是一个“更快”的Hadoop。不包含任何算法。

所以你们的工作应该是兼容的。

但实施你自己的有什么关系呢? K-means 非常简单。请参阅我的博文:
http://codingwiththomas.blogspot.com/2011/05 /k-means-clustering-with-mapreduce.html

但是我已经使用 BSP(批量同步并行)和 Apache 实现了 k-means 聚类如果将 Hama 与本书中的 Mahout 基准测试结果进行比较,它几乎快十倍:http://www. manning.com/ingersoll/(链接的 jira:https://issues.apache.org/jira/browse/MAHOUT-588)
以下是 Apache Hama 的 k-means 基准测试: http://wiki.apache.org/hama/Benchmarks

你可以在这里找到它:
https://github.com/thomasjungblut /thomasjungblut-common/blob/master/src/de/jungblut/clustering/KMeansBSP.java

As far as I know, MapR is only a "faster" Hadoop. There are no algorithms included.

So your jobs should be compatible.

But what is the deal in implementing your own? K-means is ultra simple. See my blog post:
http://codingwiththomas.blogspot.com/2011/05/k-means-clustering-with-mapreduce.html

However I have implemented a k-means clustering with BSP (Bulk Synchronous Parallel) and Apache Hama which is almost ten times faster if you compare it with the Mahout benchmark results in this book: http://www.manning.com/ingersoll/ (linked jira: https://issues.apache.org/jira/browse/MAHOUT-588)
Here is the benchmark of k-means with Apache Hama: http://wiki.apache.org/hama/Benchmarks

You can find it here:
https://github.com/thomasjungblut/thomasjungblut-common/blob/master/src/de/jungblut/clustering/KMeansBSP.java

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文