如何处理不平衡的多标签数据集?
我目前正在尝试使用带有4个标签(A,B,C,D)的Pytorch Densenet121训练图像分类模型。我有224000张图像,每个图像以的形式标记为 [1,0,0,1] (图…
我也可以使用RandomunderSampler用于分类数据吗?
AFAIK与Smote不同,RandomunDersAmpler选择了数据的子集。但是我不太有信心将其用于分类数据。 那么,它真的适用于分类数据吗?…
处理分类器的假阳性并改善具有两个功能的中型不平衡数据集培训的性能
我有以下不平衡的数据集,具有两个功能(keon ie gen and alder ie age),它们使用under_smpling方法进行了平衡,我在不同的分类器上训练了call_endi…
Sklearn Pipelines+ GridSearchCV+ XGBOOST+学习曲线
我是 sklearn &的新手 XGBoost 。 我想使用GridSearchCV调整XGBoost分类器。我想做的检查之一是对火车和测试损失的图形分析。到目前为止,我已经…
KNN算法与PYOD和PYOD结果不同的原因sklear包
除了这篇帖子之外,我使用 sklearn 和 PYOD用于异常检测任务的基准数据集上的无监督方法包,我得到了不同的结果! *********************************…
如何使用“is_unbalance”和“scale_pos_weight” LightGBM 中不平衡二元分类项目的参数 (80:20)
我目前有一个不平衡的数据集,如下所示: 然后,我在训练LightGBM模型时将其设置为 true ,使用'is_unbalance'参数。下图显示了我如何使用此参数。 使…
使用SMOTE技术处理不平衡对象数据集
在这里,我有SDF文件,这是由3个功能组成的培训数据,最后一个功能是我的输出。 我使用此功能读取数据集。 def read_sdf(file): with open(file, 'r')…
焦点损失 NLP/文本数据 pytorch - 改善结果
我有一个 NLP/文本数据分类问题,其中存在非常倾斜的分布 - 类 0 - 98%,类 1 - 2% 对于我的训练和验证数据,我正在进行过采样,我的类别分布为类别 0…
二元分类模型高斯朴素贝叶斯中的警告消息?
我正在使用一个多类分类就绪数据集,其中包含 14 个连续变量和从 1 到 10 的类。 这是数据文件: https://drive.google.com/file/d/1nPrE7UYR8fbTxWSu…
在 PyTorch 中使用焦点损失处理不平衡数据集
我在 GitHub 中找到了焦点损失的实现,并将其用于不平衡数据集二元分类问题。 # IMPLEMENTATION CREDIT: https://github.com/clcarwin/focal_loss_pyt…
- 共 1 页
- 1