文本分类分类指针

发布于 2024-12-18 04:58:15 字数 242 浏览 1 评论 0原文

我正在尝试开发一个非常简单的程序,用于使用各种算法对文档进行分类和分类。我的问题是,因为我是初学者,所以我找不到好的文章或网站来获取有关如何开始使用它的简单教程。我读过很少的资源,也学到了很多东西,但是我读到的每个文档、网站等都使用不同的技术,以不同的方式分析问题,提出不同的解决方案等,所以我很困惑。您可以向我指出一些好的资源,以便我开始实际实施吗?

另外,我正在寻找实际的测试数据和特定的分类文档,以便我可以“提供”我的算法。任何帮助表示赞赏。谢谢。

i am trying to develop a very simple program for classifying and categorising documents using various algorithms. My problem, since i am a beginner is that i cannot find good articles or websites for simple tutorials of how to get started with it. I have read quite few resources and i have learnt a lot of things but each document,site etc i read it uses different techniques, it analyses the problem in different way, proposing different solutions etc. so i am getting confused. Is there any good resources that you can point me to in order to get started with actual implementation?

Also i am looking for actual test data and specifically documents that are categorised so i can "feed" my algorithms. Any help appreciated. Thanks.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

可是我不能没有你 2024-12-25 04:58:15

对于 Python,请查看有关文本分类的 scikit-learn 教程 。另请参阅其运行的演示脚本二十个新闻组基准数据集。 [免责声明:这些内容是我共同撰写的。]

对于 Weka,这里有一个教程

For Python, check out the scikit-learn tutorial on text classification. See also its demo script that runs dozens of different text classification algorithms (including Naive Bayes and SVMs) on the twenty newsgroups benchmark data set. [Disclaimer: I co-wrote these things.]

For Weka, here's a tutorial.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文