当前位置：文江博客话题详情

数据子集的分类器性能

发布于 2024-09-18 03:29:54 字数 125 浏览 10 评论 0原文

我使用 Weka 对一组带标签的网页执行分类，并使用 AUC 测量分类器性能。我有一个单独的六级因子，未在分类中使用，我想知道分类器在该因子的每个级别上的表现如何。

我应该使用哪些技术或措施来测试数据子集上的分类器性能？

原文

分享到QQ

分享到微博

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

需要登录才能够评论，你可以免费注册一个本站的账号。

中性美 2024-09-25 03:29:54

我不确定这是否正是您要问的，但人们经常使用 cross -验证将一组数据分解为多个训练/测试子集，以更好地评估学习表现。

基本思想（例如 10 倍交叉验证）是：

将数据随机分为训练集和测试集
在训练集上训练分类器
评估其在测试集上的性能
使用不同的随机数重复步骤 1-3 九次训练/测试分割

分类器的整体性能是其在所有 10 个测试集上的平均性能。

我环顾四周，发现一些如何执行交叉的示例以编程方式进行验证或通过Weka UI。

回复收藏 0 原文

难忘№最初的完美 2024-09-25 03:29:54

Nate Kohl 推荐的步骤都是正确的。另一个非常重要的问题是衡量性能的函数。根据我的经验，最大化 AUC 有时会导致分类器出现严重偏差。我更喜欢使用 Matthews 相关系数 (MCC) 作为二元分类器或 Cohen's kappa 用于具有两个以上可能值的分类分类器

回复收藏 0 原文

~没有更多了~

关于作者

看轻我的陪伴

暂无简介

0 文章

0 评论

23 人气

关注发私信

小瓶盖

文章 0 评论 0

关注

wxsp_Ukbq8xGR

文章 0 评论 0

关注

1638627670

文章 0 评论 0

关注

仅一夜美梦

文章 0 评论 0

关注

夜访吸血鬼

文章 0 评论 0

关注

近卫軍团

文章 0 评论 0

友情链接

文江博客

数据子集的分类器性能

如果你对这篇内容有疑问，欢迎到本站社区发帖提问参与讨论，获取更多帮助，或者扫码二维码加入 Web 技术交流群。

发布评论

评论（2）

关于作者

相关话题

热门标签

推荐作者