当前位置：文江博客话题详情

文档分类的决策树

发布于 2024-09-06 15:08:26 字数 177 浏览 15 评论 0原文

我想知道是否可以使用决策树进行文档分类，如果可以，那么数据表示应该如何？我知道 R 包 party 的用法用于决策树。

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

夜唯美灬不弃 2024-09-13 15:08:26

一种方法是拥有一个巨大的矩阵，其中每一行都是一个文档，每一列都是一个单词。单元格中的值是该单词在该文档中出现的次数。

然后，如果您正在处理“监督学习”情况，则应该为分类器设置另一列，从那里您可以使用“rpart”（来自 rpart 包）之类的命令来创建分类树。该命令将以与线性模型 (lm) 类似的方式向 rpart 输入公式。

如果需要，您还可以尝试首先将单词分组为“单词组”，然后让每一列属于不同的单词组，并用一个数字指示文档中有多少单词属于该组。为此，我会看看“tm”包。（如果您最终对此做了一些事情，请考虑在这里发布相关内容，以便我们可以从中学习）

回复收藏 0 原文

携余温的黄昏 2024-09-13 15:08:26

本文对不同的文本分类技术及其准确性进行了调查。简而言之，您可以使用决策树对文本进行分类，但还有其他更好的算法。

塞巴斯蒂亚尼，F.（2002）。自动文本分类中的机器学习。 ACM计算
调查，cs.IR/0110053v1。来源：http://arxiv.org/abs/cs.IR/0110053v1 。

回复收藏 0 原文

鲜肉鲜肉永远不皱 2024-09-13 15:08:26

我对此表示怀疑——至少按照通常的定义，决策树使用单个标准来指定子分支。在对文档进行分类时，您很少可以将任何内容都基于单个标准 - 您需要多个标准，即使如此，您也不会得到明确的树状决策，但是“这比这更接近”另一件事”这样的结果。

回复收藏 0 原文

~没有更多了~

关于作者

王权女流氓

暂无简介

文章

26 人气

关注发私信

友情链接

文江博客

文档分类的决策树

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

燃烧我的卡路李先生

qq_2gSKZM

∞梦里开花

qq_IklFPL

迷途知返

深海不蓝

友情链接

文档分类的决策树

如果你对这篇内容有疑问，欢迎到本站社区发帖提问 参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（3）

关于作者

相关话题

热门标签

推荐作者

燃烧我的卡路李先生

qq_2gSKZM

∞梦里开花

qq_IklFPL

迷途知返

深海不蓝

友情链接

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。