当前位置：文江博客话题详情

nlp text-processing data-mining

当预定义类别不可用时如何对文本进行分类

发布于 2024-12-04 10:20:39 字数 250 浏览 4 评论 0原文

我有一个问题，不知道必须应用哪种算法。我正在考虑在情况二中应用聚类，但不知道情况一：

我有 50 万份信用卡活动文档。每个文档都有明确的定义，每行包含 1 个事务。日期、金额、零售商名称以及 5-20 字的零售商简短描述。样本： 2004-11-47，500美元，亚马逊，一家提供商品和服务的在线零售商，包括书籍、硬件、音乐等。问题： 1. 如果没有预先定义的类别，如何对每个条目进行分类。 2. 如果给你预先定义的类别，例如“餐厅”、“娱乐”等，你会怎么做？

收藏 0

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

评论（1）

起风了 2024-12-11 10:20:39

1) 如果没有预先定义的类别，如何对每个条目进行分类。

你不会。相反，您可以对二维数据的特征使用某种降维算法，猜测“自然”簇的数量，然后运行聚类算法。

2）如果给你预先定义的类别，例如“餐厅”、“娱乐”等，你会如何做到这一点。

你需要手动标记其中一堆，然后训练一个分类器，看看它与通常的类别配合得如何或者您可以检查聚类算法是否能够很好地识别这些类别，但您仍然需要一些标记数据。

回复收藏 0 原文

~没有更多了~

关于作者

暂无简介

文章

评论

25 人气

关注发私信

相关话题

热门标签

操作系统程序设计 IT运维 Linux系统管理 JavaScript 服务器应用 solaris C/C++ PHP Shell BSD Vue.js aix Oracle Python HTML 系统管理 HTML5 CSS 前端

推荐作者

佚名

文章 0 评论 0

羁客

文章 0 评论 0

天天爱笑的徐老师

文章 0 评论 0

星

文章 0 评论 0

夏日落

文章 0 评论 0

隐诗

文章 0 评论 0

友情链接

我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的隐私政策了解更多相关信息。单击 接受 或继续使用网站，即表示您同意使用 Cookies 和您的相关数据。

原文