贝叶斯网络的混淆矩阵

发布于 2024-09-03 16:55:11 字数 119 浏览 6 评论 0原文

我试图理解贝叶斯网络。我有一个数据文件,有10个属性,我想获取这个数据表的混淆表,我想我需要计算所有字段的tp,fp,fn,tn。是真的吗?如果这就是我需要为贝叶斯网络做的事情。

真的需要一些指导,我迷路了。

I'm trying to understand bayesian network. I have a data file which has 10 attributes, I want to acquire the confusion table of this data table ,I thought I need to calculate tp,fp, fn, tn of all fields. Is it true ? if it's then what i need to do for bayesian network.

Really need some guidance, I'm lost.

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。

评论(3

扮仙女 2024-09-10 16:55:11

该过程通常是这样的:

  • 您有一些标记的数据实例
    你想用它来训练
    分类器,以便它可以预测
    新的未标记实例的类。
  • 使用你的分类器
    选择(神经网络,贝叶斯
    net、SVM 等...)我们构建了一个
    使用您的训练数据进行建模
    作为输入。
  • 此时,您通常会想要
    来评估性能
    部署之前的模型。所以使用一个
    以前未使用的数据子集
    (测试集),我们比较模型
    这些实例的分类
    与实际班级的情况相反。一个
    总结这些结果的好方法
    是通过混淆矩阵显示
    每类实例的情况如何
    预测。

对于二元分类任务,惯例是将一个类指定为正类,将另一个类指定为负类。因此,根据混淆矩阵,正确分类为阳性的阳性实例的百分比称为真阳性 (TP) 率。其他定义遵循相同的约定......

The process usually goes like this:

  • You have some labeled data instances
    which you want to use to train a
    classifier, so that it can predict
    the class of new unlabeled instances.
  • Using your classifier
    of choice (neural networks, bayes
    net, SVM, etc...) we build a
    model with your training data
    as input.
  • At this point, you usually would like
    to evaluate the performance of the
    model before deploying it. So using a
    previously unused subset of the data
    (test set), we compare the model
    classification for these instances
    against that of the actual class. A
    good way to summarize these results
    is by a confusion matrix which shows
    how each class of instances is
    predicted.

For binary classification tasks, the convention is to assign one class as positive, and the other as negative. Thus from the confusion matrix, the percentage of positive instances that are correctly classified as positive is know as the True Positive (TP) rate. The other definitions follows the same convention...

獨角戲 2024-09-10 16:55:11

混淆矩阵用于评估分类器的性能,任何分类器

Confusion matrix is used to evaluate the performance of a classifier, any classifier.

街角迷惘 2024-09-10 16:55:11

您要求的是一个具有两个以上类别的混淆矩阵。
以下是操作步骤:

  • 为每个类别构建一个分类器,其中训练集包括
    类中的文档集(正标签)及其
    补语(负标签)。
  • 给定测试文档,分别应用每个分类器。
  • 将文档分配给得分最高的班级,即
    最大置信度值,或最大概率

这是论文的参考,您可以了解更多信息:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.

What you are asking is a confusion matrix with more than two classes.
Here is the steps how you do:

  • Build a classifier for each class, where the training set consists of
    the set of documents in the class (positive labels) and its
    complement (negative labels).
  • Given the test document, apply each classifier separately.
  • Assign the document to the class with the maximum score, the
    maximum confidence value, or the maximum probability

Here is the reference for the paper you can have more information:

Picca, Davide, Benoît Curdy, and François Bavaud.2006.Non-linear correspondence analysis in text retrieval: A kernel view. In Proc. JADT.
~没有更多了~
我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
原文