如何使用 weka 将电子邮件数据表示为基于讨论主题的分类的输入?

发布于 2024-12-25 04:14:27 字数 351 浏览 2 评论 0原文

重复:如何在weka中表示用于分类的文本?

什么如果我的数据是电子邮件(即文本数据),将成为分类器的输入?我需要考虑电子邮件中的哪些属性/功能集来根据讨论主题执行分类?

Duplicate: How to represent text for classification in weka?

What will be the input to the classifier if my data is Email, i.e, textual data? What will be the attributes/feature set in Email that I need to consider to perform classification based on discussion topic?

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(1

旧街凉风 2025-01-01 04:14:27

通常,使用 TF-IDF 将输入数据转换为稀疏向量。

Usually, one transforms the input data using TF-IDF into sparse vectors.

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文