当前位置：文江博客话题详情

数据挖掘引擎和框架？

发布于 2024-10-03 09:45:17 字数 55 浏览 10 评论 0原文

您知道并使用哪些开源/免费数据挖掘引擎和框架来处理文本数据？

感谢您的任何建议！

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

夏了南城 2024-10-10 09:45:17

不太确定您在寻找什么。也许类似于 Lucene ？

回复收藏 0 原文

So要识趣 2024-10-10 09:45:17

Apache Mahout 是一个开源 Machile 学习库，可以与或不与 MapReduce (Apache Hadoop) 一起使用。

它提供了 Java 中的以下算法实现：

协同过滤
基于用户和项目的推荐器
K 均值、模糊 K 均值聚类
均值平移聚类
狄利克雷过程聚类
潜在狄利克雷分配
奇异值分解
并行频繁模式挖掘
互补朴素贝叶斯分类器
基于随机森林决策树分类器

您可以阅读更多内容：
http://mahout.apache.org/

http://girlincomputerscience.blogspot.com.br/2010/11/apache-mahout.html

http://www.ibm.com/developerworks/java/library/j-mahout/

回复收藏 0 原文

上课铃就是安魂曲 2024-10-10 09:45:17

RapidMiner 是免费且开源的，可在 Windows、Mac、Linux 上运行，是一个基于图形工作流程的优秀程序。它运行所有 Weka 代码，并与 R 集成。

回复收藏 0 原文

昔梦 2024-10-10 09:45:17

Weka 和 Rapidminer 在集群方面没有那么强。他们主要进行分类和类似的预测，但很少进行聚类。看看 ELKI，它就像 WEKA 一个大学项目，但有大量的集群和异常值检测方法。

回复收藏 0 原文

能怎样 2024-10-10 09:45:17

我不了解引擎或框架，但我使用过这个名为 Weka< 的工具/a>，它实现了很多算法。

回复收藏 0 原文

追我者格杀勿论 2024-10-10 09:45:17

对于文本处理（而不是数值数据挖掘和聚类），NLTK 工具包值得一看。目的是教授 Python 中的自然语言处理技术。因此它非常适合进行修改，如果您选择使用 Python，您一定会发现许多有用的组件类和实现。

回复收藏 0 原文

三岁铭 2024-10-10 09:45:17

RapidMiner 是我首选的数据挖掘解决方案：
http://www.RapidMiner.com/

这是数据挖掘专家中最流行的数据挖掘工具的调查:
http://www.kdnuggets.com/2011/05 /tools-used-analytics-data-mining.html

KDnuggets 2011 年民意调查：RapidMiner 是全球数据挖掘专家中使用最广泛的数据挖掘解决方案。

回复收藏 0 原文

別甾虛僞 2024-10-10 09:45:17

我是一个用于频繁模式挖掘的 Java 开源软件的作者。它提供了挖掘顺序模式、关联规则、频繁项集等的算法。

虽然它不是专门为文本挖掘而设计的，但其中一些算法可以应用于挖掘文本中的频繁模式。例如，如果您想查找在多个句子中经常一起出现的一些单词序列，您可以应用顺序模式挖掘算法。但要做到这一点，您需要在应用我的软件之前进行一些预处理，以便您的文本文件采用正确的格式。

您可以在这里检查该软件：
http://www.philippe-fournier-viger.com/spmf/

回复收藏 0 原文

疯了 2024-10-10 09:45:17

Apache Mahout 提供了一系列流行的算法，这些算法也可以应用于文本数据，并且具有相当大的可扩展性！ Apache UIMA 不提供数据挖掘算法，而是一个广泛用于自然语言处理的框架。

回复收藏 0 原文

~没有更多了~

关于作者

一向肩并

暂无简介

0 文章

0 评论

24 人气

关注发私信

友情链接

文江博客

数据挖掘引擎和框架？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（9）

关于作者

相关话题

热门标签

推荐作者

Cooper

Great Marx

感性

mb_IvyEMzfd

止于盛夏

记忆で

友情链接

数据挖掘引擎和框架？

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（9）

关于作者

相关话题

热门标签

推荐作者

Cooper

Great Marx

感性

mb_IvyEMzfd

止于盛夏

记忆で

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。