naivebayes

naivebayes

文章 0 浏览 7

在培训垃圾邮件检测机器学习模型时获取索引错误

我正在使用从头开始创建一个垃圾邮件检测ML模型,为此,我需要所有类的可能性(或P(功能|非垃圾邮件))。为此,我创建了一个函数: import numpy as…

墟烟 2025-02-11 17:14:22 1 0

使用TFIDFVECTORIZER时如何摆脱URL

我正在使用 tfidfvectorizer 来提取样本的功能,所有文本。但是,在我的样本中,有很多URL,因此, http 和 https 成为重要功能。这也导致我天真的贝…

反话 2025-02-09 15:15:17 1 0

天真贝叶斯分类的准确性为100%

我有一个分类问题,我想为A级,B和C进行分类。我尝试使用Naive Bayes分类器,准确性为100%,我确实怀疑这是不正确的。我有350级左右的小数据集,其中…

一腔孤↑勇 2025-02-07 04:39:20 3 0

NaiveBayesClassifier太多值无法解开错误

我正在尝试建立一个情感分析模型来检查一些新闻文章,并且我有点困惑。我不太确定除了将其制作成词典之外,我还需要做些什么才能构造我的数据集。 我…

惟欲睡 2025-02-01 10:35:48 3 0

机器学习有关培训和测试数据中缺失值的问题

我正在培训文本分类器进行二进制分类。在我的培训数据中,文本部分中的.CSV文件中有空值,并且我的测试文件中也有空值。我已经将两个文件转换为数据框…

临风闻羌笛 2025-01-31 09:54:24 2 0

如何在MATLAB中使用具有离散值的FitCNB Navie贝叶斯?

这是恶性的数据。 第一列是针对性别的,其次是年龄,第三列是黑色素瘤的位置,第四张是用于诊断 该数据集的图像 %male = 1; female = 2 % head/neck =…

机场等船 2025-01-30 01:29:44 3 0

在天真的贝叶斯应用交叉验证

我的数据集是垃圾邮件和火腿菲律宾消息 我将数据集分为60%的培训,20%的测试和20%的验证数据 将数据分为测试,培训和验证培训 from sklearn.model_…

不气馁 2025-01-29 16:38:32 4 0

r

因此,这是我的情况:我有以下数据集,例如,我尝试找到一个人x性= f,体重= l,高度= t和长发= y的条件概率。 当我手工计算此内容时,概率为0.0333。…

不回头走下去 2025-01-29 14:43:43 3 0

有什么方法可以在sklearn.na.naive_bayes.gaussiannb中执行正规化?

我想知道是否有任何方法可以在sklearn.naive_bayes.gaussianb中进行正规化,例如在sklearn.neural_network.mlpclassifier或sklearn.svm.svc中抛出参数…

假情假意假温柔 2025-01-27 12:56:13 1 0

具有多个功能的Sklearn幼稚贝叶斯

背景 我正在努力在 python 中以 sklearn 跨多个功能实现幼稚的贝叶斯分类器。 我拥有的功能是: 标题 - 一些简短的文本 描述 - 一些更长的文本 时间戳…

不如归去 2025-01-24 15:31:45 3 0

如何在Weka或Excel中为不同分类器创建ROC曲线

我有一系列不同分类器的阳性类别的敏感性和特异性值。我想为每个分类器创建一条 ROC 曲线。 例如, Sensitivity specificity ROC NB 0.613 0.778 0.79…

感情洁癖 2025-01-20 17:40:09 5 0

使用训练和测试数据集在Weka中实现知识流环境

我喜欢比较各种 ROC 曲线,这些曲线是由各种分类器使用 WEKA KNOWLEDGE FLOW 平台构建的。我有一个训练数据集和一个测试数据集。我想使用训练数据集构…

满栀 2025-01-20 16:02:41 5 0

迭代幼稚的贝叶斯分类器列表

这是一个NLP问题,希望有人可以帮助我。特别尝试进行情感分析。 我有一个幼稚的贝叶斯分类器,该分类器已接受了众所周知的推文数据集的培训,这些推文…

旧情勿念 2025-01-20 06:14:54 3 0

将阵列喂给分类器

我使用贝叶斯分类器函数通过数组来循环循环。 这是我的数组: var data = ['good', { dry: 1, wet: 0, moist:0 }, 'bad', { dry: 0, wet: 1, moist: 1…

时光瘦了 2025-01-17 11:39:24 5 0

二元分类模型高斯朴素贝叶斯中的警告消息?

我正在使用一个多类分类就绪数据集,其中包含 14 个连续变量和从 1 到 10 的类。 这是数据文件: https://drive.google.com/file/d/1nPrE7UYR8fbTxWSu…

无可置疑 2025-01-15 16:12:28 5 0
更多

推荐作者

十二

文章 0 评论 0

飞烟轻若梦

文章 0 评论 0

OPleyuhuo

文章 0 评论 0

wxb0109

文章 0 评论 0

旧城空念

文章 0 评论 0

-小熊_

文章 0 评论 0

    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文