使用 FastText 进行多标签分类

发布于 2025-01-11 20:59:28 字数 99 浏览 0 评论 0原文

我想知道 FastText 是否能够处理多标签数据?有人可以分享一个简单的例子和​​混淆矩阵(真实标签与预测标签)吗?我已经查看了 FastText 文档页面。

先感谢您

I was wondering if FastText is able to deal with multi-labelled data? Could someone share a simple example along with a confusion matrix (true vs predicted labels)? I have already taken a look at FastText documentation page.

Thank you in advance

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(2

绅刃 2025-01-18 20:59:28

本节介绍多标签分类
https://github.com/ facebookresearch/fastText/blob/main/docs/supervised-tutorial.md#multi-label-classification

处理多个标签的便捷方法是使用独立的
每个标签的二元分类器。这可以通过 -loss 来完成
一对多
-loss ova

准备训练数据

这已在本节末尾进行了描述安装 fastText

文本文件的每一行都包含一个标签列表,后跟
相应文件。所有标签均以 __label __ 前缀开头,
这就是 fastText 识别什么是标签或什么是单词的方式。

This section describes multi label classification:
https://github.com/facebookresearch/fastText/blob/main/docs/supervised-tutorial.md#multi-label-classification

A convenient way to handle multiple labels is to use independent
binary classifiers
for each label. This can be done with -loss
one-vs-all
or -loss ova.

Preparing training data

That has been described at the end of the section Installing fastText

Each line of the text file contains a list of labels, followed by the
corresponding document. All the labels start by the __label __ prefix,
which is how fastText recognize what is a label or what is a word.

自由范儿 2025-01-18 20:59:28

文档,&提供标签文本的格式似乎只提到每个文本一个标签。

您可以尝试在训练数据中多次重复相同的文本,每次都使用适当的标签之一。 (您可能需要重新整理训练数据,以便此类重复的文本不会直接彼此并排出现。)

The docs, & the format for supplying labeled text, only seem to mention a single label per text.

You could try repeating the same text more than once in your training data, each time with one of the appropriate labels. (You might want to re-shuffle the training data so that such repeated texts don't appear directly alongside each other.)

~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文