在培训垃圾邮件检测机器学习模型时获取索引错误
我正在使用从头开始创建一个垃圾邮件检测ML模型,为此,我需要所有类的可能性(或P(功能|非垃圾邮件))。为此,我创建了一个函数: import numpy as…
使用TFIDFVECTORIZER时如何摆脱URL
我正在使用 tfidfvectorizer 来提取样本的功能,所有文本。但是,在我的样本中,有很多URL,因此, http 和 https 成为重要功能。这也导致我天真的贝…
NaiveBayesClassifier太多值无法解开错误
我正在尝试建立一个情感分析模型来检查一些新闻文章,并且我有点困惑。我不太确定除了将其制作成词典之外,我还需要做些什么才能构造我的数据集。 我…
如何在MATLAB中使用具有离散值的FitCNB Navie贝叶斯?
这是恶性的数据。 第一列是针对性别的,其次是年龄,第三列是黑色素瘤的位置,第四张是用于诊断 该数据集的图像 %male = 1; female = 2 % head/neck =…
有什么方法可以在sklearn.na.naive_bayes.gaussiannb中执行正规化?
我想知道是否有任何方法可以在sklearn.naive_bayes.gaussianb中进行正规化,例如在sklearn.neural_network.mlpclassifier或sklearn.svm.svc中抛出参数…
具有多个功能的Sklearn幼稚贝叶斯
背景 我正在努力在 python 中以 sklearn 跨多个功能实现幼稚的贝叶斯分类器。 我拥有的功能是: 标题 - 一些简短的文本 描述 - 一些更长的文本 时间戳…
如何在Weka或Excel中为不同分类器创建ROC曲线
我有一系列不同分类器的阳性类别的敏感性和特异性值。我想为每个分类器创建一条 ROC 曲线。 例如, Sensitivity specificity ROC NB 0.613 0.778 0.79…
使用训练和测试数据集在Weka中实现知识流环境
我喜欢比较各种 ROC 曲线,这些曲线是由各种分类器使用 WEKA KNOWLEDGE FLOW 平台构建的。我有一个训练数据集和一个测试数据集。我想使用训练数据集构…
二元分类模型高斯朴素贝叶斯中的警告消息?
我正在使用一个多类分类就绪数据集,其中包含 14 个连续变量和从 1 到 10 的类。 这是数据文件: https://drive.google.com/file/d/1nPrE7UYR8fbTxWSu…