文本分类工具

发布于 2024-10-31 03:05:02 字数 345 浏览 1 评论 0原文

我对学习文本分类感兴趣,所以也有兴趣阅读该理论。下一步是做一些事情,因此我正在寻找不同的工具。一些链接指向 WEKA,但是 Mallet 似乎更适合此任务,但没有人链接到此工具。如果想要从事“严肃”的项目,有什么理由远离 Mallet 吗?我能够使用 Mallet 快速训练一些分类器并测试它们,而使用 WEKA 时,我遇到了一个问题:在使用过滤器转换以其中文本类别命名的地图中的文本文件后,我的标签“消失”。

I am interested in learning about text classification so is reading up on the theory. Next step is doing stuff and therefore I am looking for and at different tools. Some links point to WEKA, however Mallet seems to be a better fit for this task but nobody links to this tool. Are there any reason to stay away from Mallet if wanting to work on a "serious" project ? I was able to quickly train some classifiers with Mallet and test them, whereas with WEKA I run into a problem with my labels "disappearing" after using filters to transform my textfiles in maps named with the category of the texts within it.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

手心的温暖 2024-11-07 03:05:02

这取决于您正在执行的任务。 Mallet 也是一种常用的工具,Weka 和 Mallet 都有其优缺点。
对于琐碎的任务,两者都很容易使用。我通常更喜欢 Weka 来完成聚类和分类任务。

注意:不要被 Weka 在论坛帖子中的受欢迎程度所误导,这主要是因为它的使用时间较长,而且与 Weka 相比,Mallet 是新的。

It depends on the task you are performing. Mallet is also a popularly used tool and both Weka and Mallet have their pros and cons.
For trivial tasks, both are easy to use. I generaly prefer Weka for clustering and classification tasks.

Note: Do not be misled by popularity of Weka on forum posts, it is primarily to do with it being used for a longer period of time and Mallet is new as compared to Weka.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文