将字符串标签编码为整数以进行分层多类分类

发布于 2025-01-14 06:42:43 字数 680 浏览 2 评论 0原文

目前正在处理分层分类任务，我给模型提供了一些文本输入，它告诉我它属于哪 3 个类别（主类别、子类别、叶类别）。

我的标签当前是字符串列表，但对于我的模型，我需要它们作为 0 到 N-1 之间的整数（N 是此类别级别中的类数）。

我设法通过使用字典并给每个字符串一个数字（编码）找到解决方案，然后另一个字典执行相反的操作（解码）以检查预测是什么。

它有效，但我想一旦我使用另一个数据集，我就必须再次生成两个字典。我环顾四周，从 sklearn 预处理库中找到了这两个类： MultiLabelBinarizer() 和 LabelEncoder()。它看起来像我需要的，但我不知道如何将它与层次结构结合使用。

对于如何使用它们或任何其他解决方案的任何提示，我们将不胜感激！

需要登录才能够评论，你可以免费注册一个本站的账号。

列表为空，暂无数据

暂无简介

文章

27 人气

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0

文章 0 评论 0